ذخیرهسازی دادهها توسط مشی فایلینگ
قبل از اینکه پایگاه داده های کنونی به وجود بیان، از مشی فایلینگ یا file-based system استفاده میشد که در خصوص مزایا و معایب آن توضیحات داده میشود.
ذخیرهسازی داده
بشر از مدتها قبل برای ذخیرهسازی دادهها و استفاده از آنها در آینده از روشهای مختلف استفاده میکرده است. از نقل سینه به سینه و به خاطر سپاری اطلاعات تا نوشتن و ثبت و ضبط آنها همگی روشهایی برای ذخیره سازی دادهها بوده است که در برخی از کتابهای حماسی و داستانی جهان از جمله شاهنامه حکیم فردوسی هم مشهور و مشهود است. به این ترتیب باید گفت که مفهوم پایگاه داده که محلی برای ذخیره سازی داده یا اطلاعات است، پیش از وجود کامپیوترها نیز وجود داشته است. شاید برخی از شماها کمدها و قفسههای نگهداری اسناد و مدارکی که حاوی پوشهها و اطلاعات کلیدی باشند را دیده باشید؛ آنها نیز مدت زیادی یک روش با اهمیت در ذخیره دادهها و آمار و اطلاعات به شمار میرفتند. در هر حال اولین پایگاه داده کامپیوتری در دهه 1960 ساخته شد، اما تاریخچه پایگاه های داده به گونه ای که ما امروزه آنها را می شناسیم، میتوان گفت که از سال 1970 شروع می شود.
امروزه اهمیت دادهها علاوه بر کاربرد سنتی آن برای مراجعه مجدد به آنها جهت تعیین سوابق و استفادههای مرسوم به یک رشته جذاب به نام یادگیری ماشین و هوش مصنوعی هم راه یافته است. داده به عنوان سوخت موردنیاز برای یادگیری ماشین عمل میکند و از روی همان دادهها است که جهان در آستانه یک نقطه عطف قرار گرفته است که برخی نیز پیشبینیهای عجیب و غریبی در خصوص آن میکنند.
در هر حال با توجه به مسایلی که گفته شده، اهمیت ذخیرهسازی داده، استفاده از آن، بازیابی و بهرهگیری از آن بر هیچکس پوشیده نیست. در نظر بگیرید در گذشته وقتی جنگی اتفاق میافتاد، پیش میآمد که مهاجمان کتابخانه های یک شهر را به آتش میکشیدند. به دلیل اینکه منابع علمی در جایی جز کتابخانه وجود نداشت، ممکن بود با به آتش کشیدن آن، تمام علوم یک تمدن، تاریخ و حتی آداب و سنن آنها هم به نابودی کشیده شود. به خاطر همین مسائل، علم داده و روشهای ذخیره سازی آن از اهمیت زیادی برخوردار است که در اینجا با یکی از روشهای ابتدایی ذخیره داده که مشی فایلینگ نام دارد استفاده میشویم و در ادامه با ارائه مقالات تکمیلی به روشهای مدرنتر و امروزی و توضیحات لازم در خصوص آنها خواهیم پرداخت.
مشی فایلینگ ذخیرهسازی داده
بد نیست بدونین مدتها قبل از اینکه پایگاه دادههای کنونی مانند پایگاههای مرسوم sql و nosql به وجود بیان، از مشی فایلینگ یا file-based system برای ذخیرهسازی دادهها استفاده میشد.
سیستم مدیریت داده مبتنی بر فایل (همچنین به آن سیستم فایل نیز گفته می شود)که ما آن را مشی فایلینگ در مدیریت داده مینامیم، نوعی از نرم افزار است که به کاربران امکان دسترسی و سازماندهی گروه های کوچک از داده را در قالب فایلهایی میدهد. این سیستم مدیریت داده معمولاً در سیستم عامل رایانه ادغام می شود و وظیفه ذخیره و یا بازیابی فایلها از یک رسانه ذخیرهسازی مانند هارد دیسکها یا درایوهای فلش را به عهده دارد.
برای آشنایی با مشی فایلینگ یا روش فایل پایه در ذخیرهسازی داده، در نظر بگیرید که یک سیستم شرکت، دارای تعدادی برنامه کاربردی است که هر یک از آنها برای دستکاری و کار با فایل های داده طراحی شده اند. این برنامه های کاربردی به درخواست کاربران در سازمان ساخته شده اند و در صورت لزوم برنامههای جدید دیگری هم ممکن است به سیستم اضافه شود. سیستمی که توضیح داده شد، سیستم مبتنی بر فایل نامیده می شود.
حال به عنوان مثال فرض کنید که یک منشی در مطب دکتر رحیمی، میخواد اطلاعات خانم نمازی رو ببینه. فایل سیستم با توجه به اینکه اطلاعات خانم نمازی خواسته شده، محل دقیق اطلاعات، شامل شماره¬ی سیلندر، شماره شیار و غیره رو از دیسک پیدا میکنه و اطلاعات خانم نمازی را از فایل مربوطه بر میگردونه و نتیجه رو به منشی نشون میده.
ویژگیهای مشی فایلینگ ذخیره و بازیابی داده
در اینجا یک سری از ویژگیهای مشی فایلینگ که منجر به مطرح شدن مزایا و معایبی برای این روش از ذخیرهسازی داده میشه را شرح میدیم:
1- سیستم مبتنی بر فایل پیچیده نیست و استفاده از آن سادهتر است.
2- با توجه به وژگی بالا، میتوان گفت که این سیستم کاملاً ارزان است.
3- با توجه به اینکه سیستم مبتنی بر فایل ساده و ارزان است، بنابراین معمولاً برای کاربران خانگی و صاحبان مشاغل کوچک سیستم مناسبی است.
4- به دلیل اینکه سیستم مبتنی بر فایل توسط سازمان های کوچکتر یا کاربران فردی استفاده می شود، مقدار نسبتاً کمتری از داده ها را ذخیره می کند؛ از همین رو سریع تر و آسانتر میتوان به داده ها دسترسی پیدا کرد.
5- افزونگی (Redundancy) بیش از حد دادهها: افزونگی یا Redundancy نوعی تکرار است که در صورت وجود یک نوع اطلاعات در مکان های مختلف پیش میآید. در این حالت، احتمال هدر رفتن حافظه و در نتیجه هزینه های ذخیره سازی بالاتر وجود دارد.
برای مثال فرض کنید خانم نمازی که یه عمل چشم در پیش داشت. با مرجعه به بیمارستان باید میرفت تو پذیرش پرونده تشکیل میداد. بعد میرفت بخش جراحی اونجا هم پرونده تشکیل میداد. دوباره میرفت بخش صندوق یه پرونده¬ی دیگه و ...
6- ناسازگاری(Inconsistency) دادهها: به دلیل اثر افزونگی داده ها، این اغلب منجر به ناسازگاری داده ها می شود. به این معنی که کپی های یکسانی از داده ها در مکان های مختلف دارای مقادیر متفاوتی هستند.
مثلا اطلاعات مربوط به یک نفر مثل خانم نمازی تو جاهای مختلف با هم متفاوت است. یک نوشته است خانم نگار نمازی سمنانی یکی دیگه نگار نمازی و ...
7- ایزوله بودن دادهها در زیرسیستمهای مختلف(Data Isolation) : مثلا توی قسمت جراحی، نمیشه اطلاعات قسمت پذیرش مربوط به خانم نمازی رو دید.
8- امنیت نرم افزاری پایین: هر ننه قمری که سیستم رو روشن میکنه، میتونه اطلاعات خانم نمازی رو ببینه حتی دشمناش!
9- تعدد برنامه نویس و زبان برنامه نویسی: هر بخشی با یه زبان برنامه نویسی نوشته میشه. یکی سی، یکی جاوا و ...
10- عدم امکان گرفتن کوئریهای سخت و پیچیده: مثلا نمیشه بگیم که خانم نمازی که در اتاق ارکیده عمل جراحی چشم را انجام داده، چقدر به صندوق بدهکاره.
11- هزینه نگهداری بالا
همهی این مسائل، محققین علم داده رو سوق داده تا مشی فایلینگ رو کنار بذارن و پایگاه دادهها رو استفاده کنن. پایگاه دادهها هیچکدوم از معایب بالا رو نداره.
در هر حال اما جالبه بدونید که مشی فایلینگ در مقابل مشی پایگاهی دو تا مزیت مهم داشته. اما امروزه پایگاه داده انقدر پیشرفت کرده که اون معایب اولیه رو هم نداره. حالا اون دو تا مزیت روش ناپایگاهی چی بوده؟
1- امنیت فیزیکی بالاتر: به عنوان مثال در همان مثال قبلی اگر یه سارقی میومد اطلاعات خانم نمازی رو از تو سیستم بخش پذیرش بیمارستان به سرقت میبرد. فکر میکرد همه چیز تمومه. غافل از اینکه اطلاعات خانم نمازی تو چندین بخش دیگه باز هم وجود داشتن. ولی اون اوایل که پایگاه داده اومده بود، سارق میتونست تمام اطلاعات رو بده زیر بغلش و الفرار. چون تمام اطلاعات در یک مکان به صورت متمرکز ذخیره میشدن.
2- سرعت بارگذاری اولیه بالاتر: تو مشی فایلینگ، فایلسیستم داشتیم ولی تو مشی پایگاهی یه مدیر پایگاه دادهی نرمافزاری داریم که به دلیل اینکه کارای پیچیده باید انجام بده، کلی طول میکشه بالا بیاد.
نتیجه گیری و جمعبندی
در گذشته از مشی فایلینگ برای ذخیره سازی دادهها استفاده میشد. در اون زمان مدیریت واحد برای دادهها وجود نداشت. استخراج اطلاعات دشوار بود و تکرار بیش از حد دادهها وجود داشت. همهی این موارد باعث شدن تا ما به فکر استفاده از پایگاه دادهها بیفتیم. در جلسههای بعدی با پایگاه دادهها و طراحی و پیادهسازی اونها آشنا میشیم. پس کمربندها رو ببندید و تا آخر با ما همراه باشید :)
لینک این مقاله را در شبکههای اجتماعی به اشتراک بگذارید.