فهرستي از موتورهاي جستجو       معروفترين موتورهاي جستجو

  

در اعماق وب

امروزه در مورد اعماق وب يا وب عميق بسيار صحبت مي شود. وب يا همان شبكه جهاني اينترنت امروزه داراي ماهيت پيچيده اي شده است كه شامل اطلاعاتي از منابع متفاوتي است. و اين بيش از صفحات معمولي اينترنتي است كه مشاهده مي كنيد. در حقيقت قسمتي از وب مي باشد كه به طور ديناميك عرضه مي شود و چيزي بيش از صفحات ثابتي هستند كه در اينترنت يافت مي شوند. و به اشتباه بعضي ها آن را به دلايلي كه در ادامه مطلب به آنها اشاره مي كنيم « وب نامرئي » يا "invisible web" مي نامند.

  • محتويات بانكهاي اطلاعاتي كه در وب قابل دسترسي هستند. بانكهاي اطلاعاتي شامل اطلاعاتي هستند كه در جداولي كه بوسيله نرم افزارهايي مانند Access , Oracle , SQL Server و DB2 بوجود آمده اند و با درخواست شما قابل دستيابي هستند. مقدار قابل توجهي از اطلاعات  با ارزش در بانكهاي اطلاعاتي  توليد مي شوند. تخمين ها نشان مي دهد كه محتويات وب عميق  پانصد  برابر بزرگتر از صفحات وب معمولي است.

  • فايلهاي غير متني يا none-textual مانند فايلهاي صتوتي و تصويري، فايلهاي گرافيكي و پرونده هايي مانند فايلهاي PDF.

پديده بانكهاي اطلاعاتي سالها قبل از اين كه اصطلاحات وب نامرئي يا وب عميق مصطلح شوند وجود داشته اند. همچنان كه تكنولوژي پيشرفت مي كند مقدار بيشتري اطلاعات روي اينترنت قرار مي گيرد و اين بانكهاي اطلاعاتي به عنوان اولين ابزار پيدا كردن اطلاعات استفاده مي شود.

همينطور كه موتور هاي جستجو مانند گوگل براي جمع آوري محتويات بانكهاي اطلاعاتي در توابع جستجوي خود راههاي جديد پيدا مي كنند مفهوم وب عميق هم پيچيده تر مي شود و اين شامل هر چيزي از اطلاعات پرواز تا پرونده هاي پستي مي شود. به طوري كه يك موتور جستجوي پيشرفته مانند گوگل به قسمت كوچكي از اعماق وب ( يا همان وب عميق ) دسترسي دارد.

يك كمپاني به نام Bright Planet اولين بار اصطلاح وب عميق را بكار برد تا پديده بانكهاي اطلاعاتي قابل جستجو در اينترنت را توصيف كند.

چند نكته براي كار با وب عميق

زمانيكه با اعماق وب سر و كار داريد اين نكات را بخاطر داشته باشيد:

  • اطلاعاتي كه بايد در بانكهاي اطلاعاتي ذخيره شوند جزئي از وب عميق هستند. اين اطلاعات مي تواند ليست بزرگي باشد از چيزهايي با يك موضوع مشخص و همچنين همه دايركتورها قسمتي از وب عميق هستند.

     -دفتر تلفنهاي ديجيتال

     -جستجو گر هاي اشخاص مانند ليست افراد بر اساس حرفه آنها از قبيل وكلا ، پزشكان و ...

     -اختراعات

     -قوانين

     -دايره المعارف ها

     -هر آنچه كه در فروشگاه ها و حراجي ها اينترنتي به فروش مي رسد.

     -اشكال گرافيكي

     -فايل هاي گرافيكي صوتي و تصويري

  • اطلاعاتي كه تازه هستند و مرتب تغيير مي كنند قسمتي از وب عميق هستند. اين قسمت از وب عميق شامل موارد زير است:

     -اخبار

     -موقعيت هاي شغلي

     -ليست پرواز شركتهاي هواپيمايي، اتاق هاي قابل رزرو هتل ها و غيره

     -قيمت اجناس به صورت كلي و جزئي و ...

  • يك دايركتوري موضوعي مناسب به سايتهاي داراي بانك اطلاعاتي پيوند مي دهند. علت اين است كه هر يك از بانكهاي اطلاعاتي در وب سايت هاي بخصوصي آدرس داده شده اند. پس بسته به نياز خود بايد دايركتوري مناسب را پيدا كنيد.

  • وب سايتهايي كه از طريق آنها مي توانيد به بانكهاي اطلاعاتي مورد نظر برسيد خود بوسيله موتور هاي جستجو قابل دستيابي هستند

  • بسياري از موتورهاي جستجو و سايتهاي پرتال بانكهاي اطلاعاتي قابل جستجو را به عنوان بخشي از پكيج خود در اختيار قرار مي دهند. مثلاً AltaVista امكان جستجوي جداگانه اي براي اخبار ، نقشه ها ، شغل ، حراجي ها ، هر آنچه قابل خريد فروش باشد و ... در اختيار شما قرار مي دهد. يا گوگل در سرويس جستجوي خود يك بانك اطلاعاتي از فايلهاي PDF و مطالب موجود در آن دارد.

  • بعضي از موتور هاي جستجو مشابه نتايج جستجوي شما را در اعماق وب پيدا مي كنند. مثلاً اگر "World Trade Center" را در گوگل جستجو كنيد و سپس روي لينك Images كليك كنيد فهرستي از صفحاتي كه عكسي مركز تجارت جهاني دارند را براي شما نمايش مي دهد.

  • سر فصل ها در وب عميق به شدت در حال تغيير هستند. اين يك مبارزه سخت براي داشتن اطلاعات صحيح از بانكهاي اطلاعاتي است.

منابع وب عميق

همانطور كه اشاره شد سايتهاي با محتواي وب عميق مي توانند از دايركتوري هاي موضوعي و موتورهاي جستجو يافت شوند. به علاوه وب سايتهايي هستند كه اختصاصاً روي جمع آوري آدرسها و لينكهاي بانكهاي اطلاعاتي كار مي كنند. البته توجه داشته باشيد كه هر آنچه در اين سايتها پيدا مي كنيد مربوط به وب عميق نمي شود. هيچ كدام از اين سايتها نمي توانند به طور دائم و كافي در دسترسي شما به اعماق وب را ضمانت كنند. ولي به عنوان مكمل موتورهاي جستجو و دايركتوري ها بسيار مفيد واقع مي شوند.

در اينجا چند آدرس براي كمك به شما ارائه مي شود:

 

داراي يك سيستم جستجو براي دستيابي به هزاران موتور جستجو CompletePlanet
منبع بزرگي از آدرسها و لينكهاي جمع آوري شده به منابع تحقيقاتي مختلف Direct Search
يك دايركتوري از منابع عالي براي وب عميق Invisible-web.net
يك متا موتور كه  بر اساس موضوع در وب عميق به طور عمودي جستجو در اعماق وب را انجام مي دهد. ProFusion

اگر به اين موضوع علاقه مند شده ايد CompletePlanet جزئيات بيشتري در مورد وب عميق در اختيار شما قرار مي دهد. مخصوصاً قسمت Deep Web FAQ را حتماً ببينيد. همچنين يك مجموعه ازمنابع وب عميق در Deep Web Research يافت مي شود.