دیپ وب

دیپ وب یا وب عمیق چیست؟

یک دیدگاه

دیپ وب: در این مقاله سعی شده تا با چند اصطلاح از وب جهان گستر (world wide web) آشنا شویم.

دیپ وب بخشی از وب جهان گستر است که به دلایل مختلف و منطقی توسط موتورهای جستجو ایندکس نمیشود. به صورت کلی وب به ۲ بخش سرفیس وب ( وب سطحی) و دیپ وب ( وب عمیق) تقسیم میشود.

دیپ وب لزوما جای خطرناک یا بدی نیست فقط قسمتی از وب را که به دلایل مختلف از ایندکس شدن آن با پروتکل های خاص توسط طراحان وب جلوگیری میشود را شامل میشود.

این بخش از وب کاربردهای بسیار زیادی مانند بانکداری آنلاین، سرویس های وب نامه، قسمت هایی از وب سایت ها که برای دسترسی به آن ها نیاز به پرداخت وجه یا ثبت نام وجود دارد و… را شامل میشود.

در دنیای وب برای توصیف، آنرا مانند کوه یخی در اقیانوس در نظر میگیرند. قسمتی از این کوه یخ را که بالای سطح اقیانوس قرار دارد و بخش کوچکی از آن است را سرفیس وب می نامند که این بخش برای همگان در دسترس و قابل مشاهده می باشد و بخش وسیعی از این کوه یخ را که برای همگان قابل مشاهده و در دسترس نیست را دیپ وب یا وب عمیق می نامند.

حجم وب عمیق

بررسی ها نشان می دهد که وب عمیق چیزی بین ۴۰۰ تا ۵۰۰ برابر وب سطحی می باشد ولی با توجه به سرعت بالای افزایش تعداد  وب سایت ها در جهان این رقم نیز همواره در حال تغییر می باشد.

در سال ۲۰۰۱ دانشگاه کالیفرنیا براورد هایی را انجام داد که طی آن دیپ وب را حدودا ۷.۵ پتا بایت می داند.

دیپ وب

دنیس شستاکوف روس که اصطلاح کوه یخ را برای وب مطرح نموده با بررسی هایی که در سال ۲۰۰۶ انجام داد تعداد وب سایت های روسی وب عمیق را ۱۴۰۰۰ وب سایت اعلام نمود.

اولین استفاده از واژه دیپ وب

مایکل برگمن در تحقیقی که در سال ۲۰۰۰ انجام داد به مقاله ای از جیل السورث که در سال ۱۹۹۴ منتشر شده اشاره نموده است که در آن به وب سایت هایی که توسط هیچ موتور جستجویی ثبت نام نشده اند اشاره شده است. او نیز به مقاله ای دیگر که در سال ۱۹۹۶ منتشر شده شده اشاره میکند.

در آن مقاله آمده: “ممکن است یک سایت به دلایل مختلف در هیچ موتور جتجویی ثبت نشده باشد که هیچ کس نم تواند آنها را پیدا کند. من به آن وب مخفی میگویم”.

ولی اولین استفاده خاص از واژه “دیپ وب” را مایکل برگمن در مطالعه ای که اشاره کردیم انجام داده است.

انواع محتوا در دیپ وب

وب عمیق دارای انواع محتوا می باشد که در زیر به تعدادی از آنها اشاره میکنیم.

  • وب متنی
  • محتوای پویا
  • محتوا با دسترسی محدود
  • محتوای غیر متنی مانند ویدئو های کدگزاری شده
  • وب خصوصی(سایتهایی که حتما برای ورود نیاز به ثبت نام دارند)
  • محتوای اسکریپت شده
  • نرم افزار های تحت وب
  • محتوا های لینک نشده
  • آرشیو های وب

در دیپ وب بخش دیگری نیز وجود دارد که نه تنها ایندکس نشده بلکه برای دسترسی به آن نیاز به ابزارهای خاصی وجود دارد که به آن “دارک وب” میگویند. سیع میکنم در مقاله ای دیگر به موضوع دارک وب نیز بپردازم.

امیدوارم این مقاله مورد توجه شما قرار گرفته باشد.

یک دیدگاه

ارسال یک دیدگاه

آدرس ایمیل شما منتشر نخواهد شد.