چه خواهم آموخت؟
استفاده از موتور جستجوی عمومی SPIP بسيار راحت و در عین حال بسيار قدرتمند است.
بيشتر کاربران نيازی به دانستن جزئيات نحوه عملکرد موتور جستجو ندارند اما ممکن است وب مسترها يا گردانندگان سايت بخواهند بيشتر در مورد آن بدانند.
اين درس فقط درباره موتور جستجوی عمومی است نه خصوصی.
موتور جستجوی خصوصی متفاوت با موتور جستجوی عمومی، وابسته به فهرست گذاری نيست و نتايج با توجه به محاسبه ارزش ارايه نمی شوند.
احتمال استفاده فشرده از موتور جستجوی خصوصی بسيار کمتر از موتور جستجوی عمومی است، بنابراین دسترسی به عملکرد و دقتی که با فهرست گذاری به دست می آيد در اينجا ضروری نيست.
در این درس این موارد را خواهید آموخت:
فهرست گذاری چيست، محتوا در SPIP کی و چگونه فهرست گذاری می شوند
ارزش گذاری چيست
فهرست گذاری و ارزش گذاری چگونه نتایج جستجو را محدود می کنند
نحوه گسترش جستجو به سايتهايی که مرجع قرار داده ايد چگونه است
فهرست گذاری چیست؟
در فهرست انتهای يک کتاب معمولی، کلمات (يا عبارات) براساس مفهوم توسط يک شخص انتخاب شده اند و نشانگرها شماره صفحه هستند. فهرستها به منظور راهنمايی خواننده و سرعت و سهولت در يافتن صفحات حاوی اطلاعات موردنظر وی طراحی شده اند.
فهرست SPIP نيز دقيقاً همين هدف را دنبال می کند.
اين امکان را برای موتور جستجو ايجاد می کند که مرجع مقاله يا اخبار يک کلمه را بدون نياز به خواندن کل پايگاه داده پيدا کند.
اما در مقايسه با فهرست يک کتاب، فهرست SPIP مرتباً درحال تغيير و گسترش است زيرا محتوا مرتباً درحال تغيير است.
صفحه نتایج جستجو برای جستجوی کلمه زن ها

فرض کنید که یک جستجو در مورد کلمه زن ها انجام شده و به کلمه زن ها در مقاله های 1 و 2 ارجاع شده است
بدون فهرست گذاری، برای پيدا کردن کلمه زن ها، همه مقالهها بايد خوانده شود؛ در يک سايت بزرگ اين کار حتی با يک رايانه زمان زيادی طول میکشد.
با فهرست، تنها کاری که بايد بکنيم، جستجوی کلمه زن ها در فهرست است: می توانيم فوراً کلمه را در مقاله های 1 و 2 ببينيم.
محتوای SPIP چگونه فهرست گذاری می شود؟
محتوایی که فهرست گذاری می شود حاوی همه بخش های مقاله ها، مقاله های کوتاه است و همچنین نامها و توضیحات بخش ها، واژه کلیدها، محتوای دارای پیوند سایتی موجود روی سایت SPIP شما و موارد دیگر است.
اما، در SPIP فقط کلماتی که بیش از سه حرف دارند فهرست گذاری می شوند.
اساس فهرست گذاری به طريق زير است: همه کلمات از همه متنهای سايت استخراج شده و به همراه مکان آن در پايگاه داده وارد می شود.
مقاله 1 ...مأمورين آتش و پليس برای امنيت عمومی خطر ايجاد می کنند – که بعضی اوقات منجر به مرگ افراد بیگناه می شود – با رشوه گرفتن از اشخاص و مشاغلی که نقض قانون می کنند، يک تحقيق ملی روشن ساخته است...
مقاله 2
یک مقام دولتی اظهار داشت...شرکتها مايل هستند کارگران بهارستانی غيرقانونی را ارزانتر به کار بگيرند و مأمورين دولتی نمی توانند همه آنها را دستگير کنند...
مقاله 3 ...اما مقامات دولتی می گويند دستان آنها به دليل محدوديت بودجه بسته است، بودجه ای که تلاش می کنند با آن کنار بيايند...
مقاله 4 ...مقامات سرويس گيرنده آتشنشانی و پليس تاوقتی که گزارش را نبينند، نظر نخواهند داد...
بیایید کلمات را از هر مقاله استخراج کنیم و ثبت کنیم که هر کلمه به کدام مقاله تعلق دارد:
امنيت: مقاله 1
پلیس: مقاله 1، 4
مأمورين: مقاله 1، 2
دولت: مقاله 2، 3
مقامات: مقاله 2، 3، 4
...و به همين ترتيب، درنظر داشته باشيد که سايت ما بسيار بزرگتر و مقاله ها بسيار طولانی تر از اين خواهند بود.
محتوای SPIP کی فهرست گذاری می شود؟
فهرست گذاری در سه زمان مختلف انجام می شود:
وقتی مقاله ای را منتشر می کنيد. سپس فوراً فهرست گذاری می شود.
وقتی مقاله ای را که منتشر شده، اصلاح می کنيد. دوباره فهرست گذاری می شود.
هربار که شخصی از سايت همگانی شما بازديد می کند، و به مورد فهرست گذاری نشده ای دسترسی می يابد، (برای مثال اگر گرداننده سايت به تازگی داده فهرست گذاری را حذف کرده باشد، يا يک نسخه پشتيبان پايگاه داده را بازنشانی کرده باشد – فهرستها ذخيره نمی شوند). پس به عنوان یک کار پس زمينه ای فهرست گذاری می شود.
توجه داشته باشيد که فرآيند فهرست گذاری کار نسبتاً سنگينی است: به محاسبات متعدد نياز دارد (محاسبات خيلی پيچيده نيستند ولی برای همه کلمات موجود در مقاله انجام می شوند) و مقدمه فراخوان های بسيار به پايگاه داده است.
اگر میزبان وب خیلی کند است، ترجیحاً بهتر است که موتور جستجو را غیرفعال کنید.
بنابراین توجه داشته باشيد که اگر موتور جستجو را بعد از انتشار مقاله فعال کنيد، اين مقاله ها بلافاصله فهرست گذاری نمی شوند: بازديدها از سايت همگانی مقدمه فهرست گذاری آنها خواهد بود.
در يک سايت بزرگ، اين کار ممکن است مدتی طول بکشد.