ITSI.IR – عاقبت تمام آیتم های داده توسط کامپیوتر به ترکیب هایی از صفر ها و یک ها تبدیل می شوند . دلیل این امر ساده و اقتصادی بودن ساخت قطعات الکترونیکی است که بر اساس دو وضعیت پایدار یعنی ۰ و ۱ کار می کنند .( تصویر زیر بخشی از سلسله مراتب داده را نشان می دهد )

سلسله مراتب داده

بیت :
کوچکترین آیتم داده که کامپیوتر ها از آن پشتیبانی می کنند ، بیت نامیده می شود ( کوتاه شده عبارت “binary digit” یا رقم باینری است – یک رقم می تواند یکی از دو مقدار را داشته باشد ) .هر آیتم داده یا بیت می تواند بعنوان مقدار صفر یا یک فرض گردد . مدارات کامپیوتر اعمال ساده ای بر روی بیت ها انجام می دهند ، اعمالی مانند بررسی مقدار یک بیت ، تنظیم مقدار بیت و معکوس کردن بیت ( از ۱ به ۰ یا از ۰ به ۱ ) .
کاراکتر :
اصولا برنامه نویس ترجیح می دهد که با این سطح از داده ها کار نکنند و بجای آن با داده هایی مانند ارقام دهدهی ( ۰,۱,۲,۳,۴,۵,۶,۷,۸,۹) حروف ( از A تا Z و a تا z ) . نماد های ویژه ( همانند $ ، @ ، % ، &،*،(،)،-،+،”،:،؟،/) کار کند . به ارقام ، حروف و نماد های ویژه کاراکتر گفته می شود . از مجموعه این کاراکتر ها برای نوشتن برنامه ها استفاده می شود و مجموعه این کاراکتر ها در یک کامپیوتر مجموعه کاراکتر های آن کامپیوتر نامیده می شوند . بدلیل اینکه کامپیوتر ها می توانند فقط با ۱ ها و ۰ ها کار کنند ، هر کاراکتری در مجموعه کاراکتری یک کامپیوتر با استفاده از تعدادی ۱ و ۰ ارائه می شود که ترکیب آنها با یکدیگر یک یا چند بایت را تشکیل می دهد . زبان C# از مجموعه کاراکتری شانزده بیتی Unicode استفاده می کند که از دو بایت تشکیل شده اند ( www.unicode.org ) ، بایت ها از ترکیب ( مجموع ) هشت بیت ساخته می شوند . برنامه نویس ، برنامه ها و داده ها را با استفاده از کاراکتر ها ایجاد می کند .
فیلد ها :
کاراکتر ها ترکیبی از بیت ها هستند و ترکیبی از کاراکتر ها یا بایت ها ، فیلد ها را بوجود می آورند . یک فیلد گروهی از کاراکتر هاست که معنی و مفهوم خاصی را ایجاد می کند . برای مثال ، یک فیلد شامل حروف بزرگ و کوچک می تواند در نشان دادن نام فرد بکار گرفته شود . عناصر داده توسط کامپیوتر از طریق سلسله مراتب داده ، که این عناصر را به ساختار بزرگ و پیچیده ای که آن را از بیت ها ساخته ایم ، به کاراکتر تبدیل می کند .
رکورد ها :
به طور کلی یک رکورد ، ترکیبی از چندین فیلد است . برای مثال ، در یک سیستم دستمزد ، رکورد یک کارمند ممکن است دارای فیلد های زیر باشد ( نوع ممکنه برای این فیلد ها در درون پرانتز آورده شده است ) :
– شماره شناسایی کارمند ( عدد صحیح )
– نام ( یک رشته کاراکتری )
– آدرس ( یک رشته کاراکتری )
– نرخ دستمزد ساعتی ( عددی با نقطه دسیمال )
– میزان مرخصی ( عدد صحیح )
– در آمد سالانه ( عدد با نقطه دسیمال )
– میزان مالیات بر در آمد ( عدد با نقطه دسیمال )
بنابراین یک رکورد گروهی از فیلد های مرتبط با هم است . در مثالی که اورده شده هر کدامیک از این فیلد ها متعلق به یک کارمند است .البته یک شرکت ممکن است تعداد زیادی کارمند داشته باشد و در اینحالت هر کارمند رکورد مخصوص خود را خواهد داشت ) .
فایل ها :
یک فایل گروهی از رکوردهای مرتبط با یکدیگر است. ] نکته : بطور کلی ، یک فایل حاوی داده اختیاری در فرمت های اختیاری است . در برخی از سیستم های عامل ، نگاه به یک فایل چیزی بیش از توالی ازبایت ها نیست – سازماندهی این بایت ها در فایل توسط برنامه نویس در برنامه ها صورت میگیرد [ . یک فایل دستمزد بطور عادی شامل یک رکورد برای هر کارمند می باشد . برای یک شرکت کوچک فایل دستمزد ممکن است فقط ۲۲ رکورد داشته باشد ، در حالیکه یک شرکت بزرگ ممکن است بیشتر از صد هزار رکورد در فایل دستمزد خود داشته باشد . وجود فایل های متععد که هر یک حاوی میلیون ها یا حتی تریلون ها کاراکتر اطلاعاتی باشند . چیز غیر عادی نیست . با این فایل در آینده دوره آموزش ITSI.IR آشنا خواهید شد .
پایگاه داده :
یک پایگاه داده کلکسیونی از داده ها است که برای دسترسی و دستکاری آسان سازماندهی شده اند . اکثر پایگاه داده های خوب محبوب از مدل رابطه ای برخور دار هستند و داده ها را در جداول ساده ای ذخیره می کنند . یک جدول متشکل از تعدادی رکورد و فیلد است . برای مثال ، جداولی از دانشجویان می تواند فیلد های نام ، نام خانوادگی ، رشته ، سال ، شماره دانشجویی و معدل داشته باشد . داده متعلق به هر دانشجو یک رکورد است ، و اطلاعات مجزا در هر رکورد در فیلد ها جای دارند . بر پایه رابطه بین چندین جدول یا پایگاه داده ، می توانید اقدام به جستجو یا مرتب سازی کنید .
داده های بزرگ :
حجم داده های تولید شده در گستره جهانی رو به افزایش بوده و به سرعت در حال رشد است . بر طبق مطالعات IBM ، روزانه تقریبا ۲٫۵ کونتلیوم بایت ( ۲٫۵ اگزابایت) داده تولید می شود و ۹۰% از داده جهان فقط در طی دو سال گذشته تولید شده است .بر طبق مطالعات IDC ، تقریبا ۱٫۸ زتابایت ( معادل با ۱٫۸ تریلیون گیگابایت ) داده در سال ۲۰۱۱ بکار گرفته شده است .
در جدول زیر رابطه بین واحد های سنجش بایت نشان داده شده است .

سلسله مراتب داده