یادداشت های رضا

۱ مطلب با کلمه‌ی کلیدی «deep web» ثبت شده است

میخوام یه کم از لایه های عمیق تر اینترنت براتون بگم. این چیزی که ما از اینترنت می بینیم یه لایه سطحی از اینترنته. هر چیزی که سرچ میکنیم و وب سایت هایی که سر میزنیم جزء این لایه سطحی محسوب میشن. تمام سایت ها و محتواهایی که موتورهای جستجو به ما نشون میدن به همین لایه مربوط میشه. اگه کل محتوای اینترنت رو به یک اقیانوس تشبیه کنید، هر چقدر که تور بزرگی داشته باشیم، چیزی که بدست بیاریم از این لایه پایینتر نمیره و محتواهای اون پایین رو نمی تونیم ببینیم. حالا چرا نمیتونیم ببینیم؟ دلیلش ایناس:

1- نقاطی از وب هستند که به خاطر احتیاج به نام کاربری و رمز عبور امکان دسترسی به آنها وجود ندارد.

2 - برخی اطلاعات در صورتی قابل مشاهده می گردند که خریداری شوند، این بخش که به وب ملکی شهرت دارد نیز از دید موتورهای جستجوگر پنهان است.

3 - بخش دیگری از وب نامرئی، به مجموعه ای ازاطلاعات الکترونیکی پیوسته اطلاق میشود که آنها معمولا خارج از حوزة جستجوی موتورهای جستجوگر قرار دارند هریک از این پایگاه ها صفحة جستجوی مبتنی بر وب دارند، که امکان جستجو در آ نها برای کاربران را فراهم میکند، اما خزنده های موتورهای جستجو توان ورود به آن ها را ندارند و در نتیجه حجم انبوهی از اطلاعات، نمایه نشده باقی می ماند.

4 - منابع اطلاعاتی غیرمتنی نیز جزء وب پنهان بشمار می روند چون موتورهای جستجوگر برای نمایه سازی منابع ابرمتن (Hypertext)  طراحی شده اند درحالیکه بسیاری از منابع موجود در وب در قالبهای دیگر و معمولا غیرمتنی ( تصویر ، منابع دیداری شنیداری ، …) ظاهر می شوند و امکان نمایه سازی آنها در موتورهای جستجوگر وجود ندارد.

5 – با توجه به استفاده اغلب موتورهای جستجوگر از الگوریتم عنکبوتی، در صورتی که صفحه وبی به هیچ جا متصل نشده باشد، دسترسی به آن از طریق موتورهای جستجو غیرممکن است.



چند نکته برای کار با وب عمیق 


زمانیکه با اعماق وب سر و کار دارید این نکات را بخاطر داشته باشید:
•    اطلاعاتی که باید در بانکهای اطلاعاتی ذخیره شوند جزئی از وب عمیق هستند. این اطلاعات می تواند لیست بزرگی باشد از چیزهایی با یک موضوع مشخص و همچنین همه دایرکتورها قسمتی از وب عمیق هستند.
     -دفتر تلفنهای دیجیتال
     -جستجو گر های اشخاص مانند لیست افراد بر اساس حرفه آنها از قبیل وکلا ، پزشکان و ...
     -اختراعات
     -قوانین
     -دایره المعارف ها
     -هر آنچه که در فروشگاه ها و حراجی ها اینترنتی به فروش می رسد.
     -اشکال گرافیکی
     -فایل های گرافیکی صوتی و تصویری
•    اطلاعاتی که تازه هستند و مرتب تغییر می کنند قسمتی از وب عمیق هستند. این قسمت از وب عمیق شامل موارد زیر است:
     -اخبار
     -موقعیت های شغلی
     -لیست پرواز شرکتهای هواپیمایی، اتاق های قابل رزرو هتل ها و غیره
     -قیمت اجناس به صورت کلی و جزئی و ...
•    یک دایرکتوری موضوعی مناسب به سایتهای دارای بانک اطلاعاتی پیوند می دهند. علت این است که هر یک از بانکهای اطلاعاتی در وب سایت های بخصوصی آدرس داده شده اند. پس بسته به نیاز خود باید دایرکتوری مناسب را پیدا کنید.
•    وب سایتهایی که از طریق آنها می توانید به بانکهای اطلاعاتی مورد نظر برسید خود بوسیله موتور های جستجو قابل دستیابی هستند
•    بسیاری از موتورهای جستجو و سایتهای پرتال بانکهای اطلاعاتی قابل جستجو را به عنوان بخشی از پکیج خود در اختیار قرار می دهند. مثلاً AltaVista امکان جستجوی جداگانه ای برای اخبار ، نقشه ها ، شغل ، حراجی ها ، هر آنچه قابل خرید فروش باشد و ... در اختیار شما قرار می دهد. یا گوگل در سرویس جستجوی خود یک بانک اطلاعاتی از فایلهای PDF و مطالب موجود در آن دارد.
•    بعضی از موتور های جستجو مشابه نتایج جستجوی شما را در اعماق وب پیدا می کنند. مثلاً اگر "World Trade Center" را در گوگل جستجو کنید و سپس روی لینک Images کلیک کنید فهرستی از صفحاتی که عکسی مرکز تجارت جهانی دارند را برای شما نمایش می دهد.
•    سر فصل ها در وب عمیق به شدت در حال تغییر هستند. این یک مبارزه سخت برای داشتن اطلاعات صحیح از بانکهای اطلاعاتی است.


* آمارهای جالب:
- اطلاعات موجود در وب ژرف، بین ۴۰۰ تا ۵۵۰ برابر وب عمومی هستند که ما می بینیم
- وب ژرف حاوی ۷۵۰۰ ترابایت اطلاعات است، در مقابل وب سطحی ۱۹ ترابایت ذخیره کرده است
- وب ژرف دارای نزدیک به ۵۵۰ بیلیون مستند می باشد در حالیکه این رقم برای وب سطحی ۱ بیلیون است
- بیش از ۲۰۰ هزار وب سایت ژرف وجود دارند
- جالب است بدانید که بیش از نیمی از محتوای وب عمیق در عنوان سایتهایشان از کلمه Database استفاده کرده اند و اگر این کلمه را در جستجوهایتان بکار برید، امکان دسترسی تان را به این سایتها افزایش می دهید.

خب حالا میرسیم به جاهای کثیف وب عمیق:

بخشی از محتوی  وب عمیق را، مطالب تحقیقاتی شکل می دهد که در اختیار افراد معدودی قرار دارد، ولی بخش دیگری از آن در اختیار مردمانی است که از آن برای نیل به اهداف “کثیف” خود استفاده می کنند. قسمتی از این فعالیت ها  شامل  فروش مواد مخدر و مواد روان گردان، فروش تسلیحات نظامی، نارنجک های دستی و تجهیزات حملات تروریستی است. از معروف ترین فروشگاه های الکترونیک این محصولات می توان به Silk Road اشاره کرد. Silk Road مانند یک e-bay برای فروش مواد مخدر است. پستچی پاکتی حاوی آنچه که دوست دارید را به شما تحویل خواهد داد، بدون اینکه کسی از چیزی بویی ببرد.

ولی این همه ماجرا نیست، می توان گفت این بخش تمیزی از وب عمیق است. گروه هایی هستند که از وب عمیق و تکنولوژی های پدید آورنده ی آن جهت اهدافی مانند فروش و انتشار فیلم های Snuff استفاده می کنند. این دسته از فیلم ها که در استدیوهای مخفی و خانگی ضبط می شوند به لذت جنسی از طریق قتل یا قطع عضو فرد مفعول اتلاق می شود. شرح مفصلی از این پدیده در فیلم  ۸MM   آمده است. این فیلم ها به دستور افراد مریضی تولید می شوند که دچار اختلالات روانی شدید هستند. ولی ماجرا به اینجا ختم نمی شود، دسته دیگری از تولیدات این افراد Child Snuff نام دارد که بشدت در حال گسترش است. تفکر این افراد که اغلب متعلق به گروه هایی به نام های Heaven666 و امثالهم هست، بسیار شدیدتر از گرداندگان وب سایت هایی مانند rotten dot com است. ( لطفا، حتما به این وب سایت مراجعه نکنید، وگرنه عواقب روانی آن با خودتان است )، همچنین از دیگر محتویات این وب سایت ها می توان به فیلم هایی در رابطه با مرگ بر اساس رابطه جنسی با حیوانات، رابطه جنسی با مردگان، تکه تکه کردن و خوردن انسان ها، همجنس بازانی که هدف خود را توزیع HIV میدانند و موارد دیگری که با نوشتن آنها دچار تهوع میشوم ! اشاره کرد.

دسترسی به وب عمیق

دسترسی به آنچه که در لایه های پایین می گذرد زیاد ساده نیست. چراکه بیشتر ارتباط ها و خرید و فروش های اصلی توسط لینک ارتباطی امن بین طرفین برقرار می شود. ارتباطی که از نظرگاه همه موتورهای جستجوگر فرسنگ ها فاصله دارد. ولی وب سایت هایی هم هستند که عموم مردم را مورد هدف قرار می دهند. این وب سایت ها بر روی سرورهای TOR راه اندازی شده اند و از طریق مرورگرهای معمولی قابل دستیابی نیستند. root name این وب سایت ها اغلب onion. است که در DNS های root ثبت نشده و فقط بر روی سرورهای TOR تعریف شده است. همچنین URL آنها، بسادگی به یاد سپردنی نیست و هرچند وقت یکبار به کل تغییر می کند. اغلب این وب سایت ها دارای صفحات سیاه رنگی حاوی چند متن مختصر هستند. یکی از مراجعی که اطلاعات دسته بندی شده این وب سایت ها را در اختیار کاربران می گذارد Hidden Wiki است.


به متن این عکس دقت کنید:



این پست رو با جمع آوری از چند منبع نوشتم:

این، این، این و این