داده تاریک: آینده روشن یا سراب خطرناک
داده تاریک (Dark Data) یکی از تازه ترین مباحث در مقوله داده های بزرگ , تجزیه و تحلیل آن ها است؛ مبحثی که اگر به درستی شناخته و به کار گرفته شود، نه تنها می تواند منبع درآمد مناسبی برای سازمان ها و شرکت های بزرگ باشد؛ بلکه از یک سو می تواند باعث تحرک و رونق شرکت های فنی مرتبط با بیگ دیتا، پردازش و تجزیه و تحلیل، داده کاوی و ذخیره سازی داده ها شود و از سوی دیگر، می تواند اطلاعات بسیار مناسبی را برای ساخت رفتار کاربران در اندازه های بزرگ، در اختیار اقتصاددانان، جامعه شناسان، روانشناسان اجتماعی و برنامه ریزان شهری قرار دهد.
دارک دیتا چیست؟
تعریف موسسه گارتنر از دارک دیتا چنین است: «اطلاعاتی که یک سازمان در طول فعالیت عادی خود، گردآوری، پردازش و ذخیره سازی کرده است و جزیی از دارایی های آن به حساب می آید؛ اما نتوانسته است برای مقاصد دیگری از آن ها استفاده کند».
عده ای در تعریف دارک دیتا، بر نقش آن در تصمیم گیری های سازمان ها و راهبردهای آنان در آینده، تاکید می کنند.
سازمان های بزرگی مانند تامین اجتماعی و سایر موسسات بیمه ای، سازمان فنی حرفه ای، آموزش و پرورش، بانک ها، شرکت های ارایه کننده خدمات تلفن ثابت و همراه و تعداد زیادی از موسسات دیگر با این مبحث مرتبط هستند. یکی از این سازمان ها را در نظر بگیرید. این سازمان در جهت انجام کارهای عادی خود در طول یک سال، با ده ها و بلکه صدها هزار انسان سروکار دارد و به نوعی، اطلاعات آن ها را در جایی ذخیره می کند؛ اما در بسیاری از موارد، به غیر از همان استفاده اولیه از این اطلاعات، هیچگونه استفاده دیگر از این داده ها صورت نمی گیرد.
نه تنها در ایران، بلکه آن چنان که متخصصان امر می گویند، در بسیاری از کشورهای دنیا، اغلب داده های سازمان های بزرگ را باید در شمول دارک دیتا تلقی کرد؛ اگرچه بخشی از این داده شاید جزو حریم خصوصی مردم باشد و استفاده از آن ها چه به لحاظ قانونی و چه به لحاظ اخلاقی، مجاز نباشد؛ اما بخش های دیگری از آن ها می تواند، در مقاصد پژوهشی و بررسی های اجتماعی و راهبردهای کلان اقتصادی، مورد استفاده قرار گیرد.
یکی از مشکلات مربوط به این داده ها، ذخیره سازی و امن نگه داشتن آن هاست که هزینه بالایی طلب می کند و این در حالی است که در بسیاری از موارد، هنوز ارزش این داده ها مشخص نشده است.
دارک دیتا، نوعا بدون ساختار، بدون برچسب و دست نخورده، در درون انبارهای ذخیره سازی یافت می شود و عموما تجزیه و تحلیل نشده است. این داده ها شبیه بیگ دیتاها هستند؛ با این تفاوت که ارزش آن ها عمدتا توسط سازمان یا مدیران آی تی، مورد غفلت قرار گرفته است. اغلب داده های تاریک، به گونه ای ذخیره شده اند که برای تجزیه و تحلیل دشوار، پیچیده و پرهزینه هستند؛ همچنین این داده ها می توانند اطلاعاتی را شامل شوند که توسط خود شرکت تهیه نشده اند و خارج از سازمان، توسط مشتریان یا شرکا ذخیره شده اند.
با رشد نمایی داده های ساخته یافته، نیمه ساخت یافته و بدون ساختار در سازمان ها، دارک دیتا به معنای داده های عملیاتی در نظر گرفته می شود که می تواند قابلیت تجزیه و تحلیل را پیدا کند؛ اگر شرکت ها ارزش این داده ها را بدانند، می توانند از آن ها به عنوان فرصتی برای افزایش درآمد یا کاهش هزینه های داخلی خود، استفاده کنند. بعضی از داده هایی که می توانند در این دسته قرار بگیرند، شامل این موارد هستند: فایل های لاگ سرور که کلیدهای رفتاری بازدیدکنندگان وب سایت ها را ارایه می دهند، جزییات ضبط شده تماس های تلفنی که احساسات و عواطف مشتریان را نشان می دهد یا داده های مربوط به موقعیت های مکانی دارندگان موبایل، که الگوهای ترافیکی را آشکار می کنند؛ همچنین دارک دیتا می تواند برای توصیف داده هایی به کار رود که مدت هاست در دسترس نیستند؛ زیرا روی وسایلی ذخیره شده اند که منسوخ شده اند.
انواع دارک دیتا
1. داده هایی که به تازگی جمع آوری نشده اند.
2. داده هایی که جمع آوری شده اند؛ اما دسترسی به آن ها در زمان و در جای مناسب دشوار است.
3. داده هایی که جمع آوری شده اند و در دسترس هستند، اما هنوز پردازش نشده اند.
شاید بتوان به این سه دسته از داده ها، نوع چهارمی را نیز افزود که شامل داده هایی می شود که سازمان ها هر روز آن ها را تولید می کنند؛ اما در جایی ذخیره نمی کنند.
داده تاریک بر خلاف ماده تاریک، این ظرفیت را دارد که پرتو نوری بر آن افکنده شود و سرمایه گذاری مجددی روی آن انجام شود؛ در واقع موضوع اصلی این است که چگونه می توان با استفاده از روش های علمی و بر اساس روش فایده- هزینه، پیچیدگی ها و رمز و راز اطراف داده تاریک را حذف کرد و آن را برای استفاده و سرمایه گذاری مجدد آماده کرد.
ارزش داده تاریک
اولین چالشی که داده تاریک در مقابل ما می گذارد، تعیین ارزش واقعی آن است؛ البته اگر اساسا ارزشی داشته باشد؛ در هر صورت مقداری از داده، تاریک باقی می ماند؛ زیرا سازمان ها اساسا نمی دانند که این داده ها چه هستند. از بین بردن آن ها ممکن است خطر بزرگی در بر داشته باشد؛ اما تحلیل آن ها نیز هزینه بر است. برآورد این هزینه، برای کاری که ارزش آن نامشخص است، سخت است. مساله مهم این است که سازمان باید دلیلی داشته باشد که به سرعت و با هزینه متناسب، داده ها را مرتب کند، ساختار دهد و تحلیل کند؛ در واقع باید به این مهم برسیم که دارک دیتا اتفاقی نیست که تنها یک بار می افتد.
در اولین قدم برای درک ارزش دارک دیتا، باید مشخص کنیم که این داده ها شامل چه اطلاعاتی هستند، کجا نگه داری می شود وضعیت فعلی آن ها، به لحاظ زمانی که از آن ها گذشته، چگونه است. برای رسیدن به این نقطه، به این موارد نیاز داریم:
تجزیه و تحلیل داده برای درک اینکه، در حال حاضر میزان آن چقدر است، کجاست و همجنین به لحاظ اینکه ساختار یافته، بدون ساختار یا نیمه ساخت یافته است.
طبقه بندی داده برای اینکه قابل فهم باشد و همچنین از هر نوع داده چه مقدار داریم و طبیعت کلی اطلاعات، شامل کدام نوع است و مواردی مانند سن داده و ...
دسته بندی اطلاعات بر این مبنا که بعدا چه اتفاقی برای آن ها می افتد؛ آرشیو می شوند، نابود می شوند یا به مطالعه عمیق احتیاج دارند. وقتی تصمیم گرفتیم، می توانیم هر گروه را به خانه مناسب آن ارسال کنیم تا آن دسته از داده هایی که به مطالعه بیشتر نیاز دارند را پیدا کنیم.
هنگامی که زمینه مرتبط با اطلاعات را پیدا کردیم، حالا باید روی داده هایی که ممکن است بینشی به ما بدهند، تمرکز کنیم. در این صورت تصویر بزرگتری از رابطه این اطلاعات با سازمان خود خواهیم داشت و می توانیم سیاست های کاری خود را در مورد این اطلاعات به گونه ای تنظیم کنیم که از وزن و بار داده تاریک کاسته و امکان استفاده از آن فراهم شود.
آینده داده تاریک
شاید برای شرکت هایی که تازه شروع به فعالیت می کنند، در کوتاه مدت، موضوع داده های تاریک خیلی مهم نباشد. آن ها داده های تازه خود را تولید می کنند؛ اما در گذر زمان یک روز متوجه می شوند که انبوهی از داده ها که نمی دانند چیست، در انباره های خود ذخیره کرده اندو نمی دانند با آن ها چه کنند. اینجاست که باید به سراغ افراد و شرکت هایی بروند که این توانایی را دارند که بتوانند از داده های تاریک ارزش بیافرینند.
بسیاری از متخصصان حوزه بیگ دیتا و داده کاوی، باید خود را برای این حوزه جدید آماده کنند. حوزه ای که این بار چیزهای با ارزش را، از دل تاریکی ها بیرون می کشد؛ البته تعدادی از صاحب نظران این حوزه، پرداختن به داده های تاریک را خطرناک می دانند. عمده این خطرات، مشکلات قانونی و آلودگی اطلاعاتی و مسایل اخلاقی هستند؛ داده هایی از این دست، جزو دارایی های هر سازمان به حساب می آیند و تصمیم گیری در مورد استفاده یا عدم استفاده از آن ها، تنها بر عهده مالک آن و با رعایت موازین قانونی و اخلاقی، مجاز است.
چه کسانی با دارک دیتا سروکار دارند؟
1. شرکت ها و سازمان هایی که با حجم زیادی از اطلاعات کارمندان، مشتریان و سرمایه گذاران در ارتباط هستند؛ مانند شرکت های بیمه، خودروسازی، لیزینگ، هولدینگ، بانک ها، آموزش و پرورش، دانشگاه های بزرگ و وزارتخانه ها.
2. وب سایت هایی که در کار خرید فروش کالا و خدمات هستند یا وب سایت های خبری و محتوایی که با مخاطبان زیادی سروکار دارند.
3. شرکت های کامپیوتری که در کار هوش مصنوعی، دیتا ماینینگ بیگ دیتا و ذخیره سازی داده ها هستند.
4. شرکت هایی که در کار ساخت و یا ارایه دیتا سنتر و دیگر ابزارهای شبکه هستند.
5. شرکت هایی که ارایه دهنده خدمات تلفن همراه، اینترنت موبایل، هاستینگ، دامنه و ... هستند.
6. متخصصان هوشم مصنوعی، بیگ دیتا، شبکه، مدیران آی تی شرکت ها و سازمان های بزرگ.
جمع بندی: مزایا و معایب
شاید کمتر کسی فکر کند که اطلاعات خاموش و تاریک نهفته در دل دیسک های فشرده، هاردیسک ها و انبارهای ذخیره سازی سازمان های بزرگ، می توانند راهگشای بعضی از مشکلات جوامع امروزی باشند؛ همچنین می توانند به وجودآورنده ارزش های مالی برای سازمان ها و رونق دهنده کسب و کار شرکت های فناوری در حوزه شبکه و دیتا باشند؛ اما این واقعیتی است که در جوامع پیشرفته، به یک کسب و کار پر رونق و تاثیرگذار تبدیل می شود؛ در عین حال، اگر این کار توسط افراد دارای صلاحیت و با رضایت مالک آن صورت نگیرد، می تواند مشکلات بزرگی را برای افراد و سازمان ها پدید آورد.
در این مقاله سعی کردیم توجه سه دسته مخاطب را به یک موضوع تازه جلب کنیم: اول شرکت ها و سازمان های بزرگ که صاحب دارک دیتا هستند؛ دوم شرکت های تخصصی و افراد متخصصی که تونایی خوانش، پردازش مجدد، تجزیه و تحلیل و کشف معانی تازه از چنین داده هایی را دارند و در نهایت افراد و موسسات علاقه مند به مباحث اقتصادی و اجتماعی، که احتمالا می توانند در مبحث دارک دیتا، منافعی را برای جامعه بیابند.
به نقل از ماهنامه شبکه.
www.SAMSUNGCENTER.ir