ما هي ميزانية الزحف Crawl Budget ولماذا تهم المواقع الكبيرة؟

ميزانية الزحف من أكثر المصطلحات التي يُساء فهمها في السيو. كثير من أصحاب المواقع يظنون أنها السبب الأول وراء ضعف الظهور، بينما الحقيقة أن جوجل نفسها توضح أن هذا الموضوع لا يصبح مؤثراً فعلاً إلا في حالات محددة، خصوصاً عند المواقع الكبيرة جداً أو المواقع التي تتغير بسرعة أو المواقع التي تنتج عدداً ضخماً من عناوين URL غير المهمة أو المكررة. لذلك، إذا كان موقعك صغيراً أو متوسطاً وتُزحف صفحاته المهمة بسرعة معقولة، فغالباً مشكلتك ليست في ميزانية الزحف أصلاً.
المهم هنا ليس حفظ التعريف فقط، بل فهم كيف تحدد جوجل عدد الصفحات التي تستطيع وتريد الزحف إليها، وما العوامل التي تجعل هذا العدد يرتفع أو يتراجع، وكيف تميز بين مشكلة في تحسين الزحف ومشكلة في الفهرسة أو الجودة أو البنية الداخلية. في هذا المقال سنفكك المفهوم عملياً، ثم نحوله إلى خطوات واضحة تساعدك على ترتيب الأولويات قبل أن تبدأ بأي معالجة تقنية.
ما هي ميزانية الزحف فعلياً؟
تعرّف جوجل ميزانية الزحف على أنها مجموعة عناوين URL التي يستطيع Google الزحف إليها ويريد الزحف إليها. هذا التعريف مهم لأنه يوضح أن الموضوع ليس حداً رقمياً ثابتاً لكل موقع، بل نتيجة تفاعل عاملين رئيسيين: الحد الأقصى لسعة الزحف وطلب الزحف. كما أن الصفحة التي تُزحف إليها لا تُفهرس بالضرورة، لأن جوجل تقيّمها بعد الزحف لتقرر إن كانت مناسبة للفهرس أم لا.
بمعنى أبسط، ميزانية الزحف ليست عدد الصفحات الذي تسمح لك جوجل به يومياً، بل هي مقدار الوقت والموارد التي تخصصها زواحفها لموقعك على مستوى اسم المضيف. ولهذا تذكر جوجل أن www.example.com وcode.example.com يُعاملان بوصفهما اسمَي مضيف مختلفين، ولكل منهما ميزانية زحف منفصلة. هذه النقطة مهمة جداً للمواقع التي توزع المحتوى أو الموارد على نطاقات فرعية متعددة.
لماذا لا تهم كل المواقع بنفس الدرجة؟
جوجل تذكر بوضوح في دليل تحسين ميزانية الزحف أنه إذا كان موقعك لا يتضمن عدداً كبيراً من الصفحات سريعة التغيّر، أو إذا كانت الصفحات تُزحف في يوم نشرها نفسه، فأنت غالباً لا تحتاج إلى القلق كثيراً بشأن هذا الملف. كما أن الدليل نفسه موجّه أساساً إلى المواقع الكبيرة جداً التي تتجاوز مليون صفحة فريدة مع تغيّر معتدل، أو المواقع التي تتجاوز 10,000 صفحة فريدة مع تغيّر يومي، أو المواقع التي يظهر فيها عدد كبير من الحالات من نوع تم اكتشاف الصفحة ولم تتم فهرستها حتى الآن.
والأمر نفسه يظهر في تقرير إحصاءات الزحف، حيث تذكر جوجل أن المواقع التي تحتوي على أقل من ألف صفحة غالباً لا تحتاج إلى هذا المستوى من التفاصيل أصلاً. لذلك، إذا كان لديك موقع شركة صغير أو مدونة محدودة الصفحات، فالأولوية عادةً تكون لفحص سيو الموقع وتحسين السيو التقني وتحسين المحتوى الداخلي قبل التفكير في ميزانية الزحف كسبب أول للمشكلة.
ما الذي يحدد ميزانية الزحف؟
1) الحد الأقصى لسعة الزحف
الجزء الأول من المعادلة هو الحد الأقصى لسعة الزحف، ويعني الحد الأعلى لعدد الاتصالات المتوازية والمتزامنة التي يمكن لزواحف جوجل استخدامها للزحف إلى موقعك، إضافة إلى التأخير بين عمليات الجلب. هدف جوجل هنا أن تغطي المحتوى المهم من دون أن تُحمّل الخادم عبئاً زائداً. إذا كان الموقع يستجيب بسرعة وبدون أخطاء لفترة جيدة، قد يرتفع هذا الحد. وإذا كانت الاستجابة بطيئة أو تتكرر أخطاء الخادم، فقد ينخفض معدل الزحف.
لهذا السبب لا يكون الأداء التقني مجرد عامل تجربة مستخدم فقط، بل يدخل أيضاً في قدرة جوجل على الزحف بالمعدل الذي تريده. وتوضح جوجل في تحديد أخطاء الزحف وحلّها أن مشاكل التوفّر على مستوى الخادم قد تمنع Googlebot من الزحف إلى الموقع بالمعدل المرغوب، حتى لو كانت بقية الإشارات جيدة. وهذا يشرح لماذا قد يبدو الموقع منشوراً بالكامل، لكن الزحف إليه يبقى أبطأ من المتوقع.
2) طلب الزحف
العامل الثاني هو طلب الزحف، وهو ببساطة مقدار رغبة جوجل في إعادة زيارة صفحات موقعك. هذا الطلب لا يتحدد عشوائياً، بل يتأثر بعدة عوامل، منها: عدد عناوين URL التي تعرفها جوجل على موقعك، ومدى رواج الصفحة، ومدى قِدم المحتوى، وتكرار التحديثات، وحتى أحداث مثل نقل الموقع أو تغيير بنية العناوين. كما تشير جوجل إلى أن المواقع التي تحتوي على كثير من عناوين URL غير المهمة أو المكررة تجعل الزحف أقل كفاءة، لأن جزءاً من الوقت يُصرف على صفحات لا تضيف قيمة فعلية.
وهنا تظهر نقطة مهمة جداً: ليس كل توسيع للموقع جيداً من منظور الزحف. إذا كنت تنشئ عدداً كبيراً من الصفحات الضعيفة أو المتشابهة جداً أو المفلترة آلياً، فأنت لا تزيد فرصك، بل قد تخلق عبئاً يجعل الزواحف تقضي وقتاً أطول في عناوين أقل أهمية. لذلك، حين نبني في وورديان استراتيجية محتوى أو نعيد ترتيب كتابة محتوى المواقع وصفحات الهبوط، لا ننظر فقط إلى عدد الصفحات، بل إلى قيمتها، وتكرارها، وما إذا كانت تستحق أن تُستهلك فيها موارد الزحف أم لا.
ما العلامات التي تدل على أن ميزانية الزحف أصبحت مشكلة فعلية؟
أول علامة عملية أن تبدأ بمراجعة تقرير إحصاءات الزحف داخل Search Console إذا كان موقعك كبيراً بما يكفي. هذا التقرير يعرض عدد الطلبات، وأوقات الزحف، واستجابة الخادم، وأي مشكلات متعلقة بالتوفّر. فإذا لاحظت تكرار التحذيرات أو بطئاً واضحاً في الزحف أو تفاوتاً كبيراً بين ما تنشره وما تراجعه جوجل، فهنا يبدأ الموضوع بالتحول من نظرية إلى مشكلة تشغيلية حقيقية.
العلامة الثانية أن يظهر في موقعك عدد كبير من الحالات التي تندرج تحت تم اكتشاف الصفحة ولم تتم فهرستها حتى الآن. جوجل نفسها تذكر هذه الحالة ضمن الفئات التي قد تستفيد من مراجعة ملف ميزانية الزحف، خصوصاً إذا كانت النسبة مرتفعة على مستوى أقسام كاملة من الموقع، لا على صفحات متفرقة فقط. عندها يجب أن تسأل: هل المشكلة في الكم الكبير من الصفحات؟ أم في ضعف الطلب عليها؟ أم في البنية التي تدفع جوجل إلى إنفاق الوقت على صفحات أقل أهمية؟
العلامة الثالثة أن تكتشف أن الصفحات الجديدة أو المحدثة تستغرق وقتاً طويلاً غير معتاد حتى تُراجع، رغم أن خريطة الموقع محدثة والربط الداخلي موجود. في هذه الحالة قد لا تكون المشكلة في النشر، بل في أن جوجل لا ترى جدوى كافية من إعادة زيارة عدد ضخم من الصفحات الحالية بسرعة. وهنا يصبح ترتيب الأولويات، وإدارة المخزون الفعلي من عناوين URL، أكثر أهمية من إنتاج صفحات إضافية.
ما الذي يهدر ميزانية الزحف في المواقع الكبيرة؟
أكثر ما يمكن التحكم فيه، بحسب جوجل، هو إدارة عناوين URL المخزّنة التي ترصدها. فإذا قضت الزواحف وقتها في عناوين مكررة، أو صفحات منتهية، أو نسخ فلترة وفرز لا تضيف محتوى جديداً، فذلك يسحب جزءاً من الوقت الذي يمكن أن يذهب إلى الصفحات المهمة. لهذا السبب توصي جوجل بدمج المحتوى المكرر والتركيز على محتوى فريد بدلاً من مجرد عدد أكبر من عناوين URL.
كذلك، توصي جوجل بحظر الزحف إلى عناوين URL غير المهمة باستخدام robots.txt عندما تكون هذه الصفحات غير مهمة للظهور ولا تريد إعادة معالجتها، مثل بعض نسخ التمرير اللانهائي أو النسخ المرتبة من الصفحة نفسها. لكن هناك نقطة دقيقة هنا: لا يجب استخدام robots.txt كحل مؤقت لإعادة توجيه ميزانية الزحف إلى صفحات أخرى، لأن جوجل لا تعيد بالضرورة توزيع الميزانية المتاحة حديثاً فوراً على بقية المحتوى ما لم يكن الموقع أصلاً يصل إلى حدّه الأعلى من السعة.
ومن النقاط التي يقع فيها كثيرون أيضاً أن استخدام noindex لا يوفّر ميزانية الزحف مباشرةً، لأن جوجل تحتاج أن تزحف إلى الصفحة أولاً كي ترى قاعدة noindex. على المدى الطويل قد يخف الضغط إذا خرجت تلك الصفحات من الفهرس، لكن noindex ليس أداة مباشرة للتحكم بالزحف نفسه. ولهذا تذكر جوجل صراحةً في المعلومات الخاطئة حول عملية الزحف أن noindex قد يحرّر بعض المساحة بصورة غير مباشرة بمرور الوقت، لكنه ليس أداة آنية لإدارة الميزانية.
ومن المفاهيم التي تستحق التصحيح أيضاً أن صفحات رموز 4xx لا تُعد تلقائياً هدراً لميزانية الزحف، باستثناء بعض الحالات الخاصة مثل 429. في المقابل، تشير جوجل إلى أن أخطاء soft 404 تستمر في استهلاك الميزانية لأن الصفحة تُعامل كأنها صفحة قائمة لكنها بلا قيمة فعلية، ولهذا تنصح بإزالتها أو تصحيحها. كما أن سلاسل إعادة التوجيه الطويلة تؤثر سلباً في عملية الزحف وتزيد الكلفة التشغيلية للوصول إلى الصفحة النهائية.
وعلى مستوى أعمق، توضح جوجل أن أي عنوان URL يتم الزحف إليه يدخل ضمن ميزانية الزحف، بما في ذلك عناوين URL البديلة مثل hreflang وAMP، وكذلك الموارد المضمنة مثل CSS وJavaScript وطلبات XHR. كما تضيف في شرحها لكيفية زحف Googlebot إلى الصفحات أن الموارد اللازمة للعرض قد تستهلك جزءاً من الميزانية، وأن تقليل الموارد غير الضرورية أو تغيّر عناوينها بشكل مستمر قد يحسن الكفاءة.
كيف تحسن ميزانية الزحف عملياً من دون حلول شكلية؟
أول خطوة هي تقليص مخزون عناوين URL غير المفيد. اسأل نفسك: هل كل صفحة على الموقع تستحق أن تُزحف فعلاً؟ إذا كانت لديك نسخ كثيرة من الصفحات نفسها بسبب الفلاتر أو الترتيب أو الصفحات المؤرشفة أو الصفحات المنتهية التي ما زالت تعيد استجابة غير واضحة، فابدأ هناك. هذا النوع من العمل ليس مجرد تنظيف تقني، بل جزء أساسي من تحسين السيو التقني لأنه يقلل الضوضاء التي تربك الزحف والفهرسة معاً.
الخطوة الثانية هي الحفاظ على خريطة الموقع محدثة، وإضافة الوسم <lastmod> عند وجود محتوى متغير. جوجل تقرأ خريطة الموقع بانتظام، ولهذا يكون من المفيد أن تعكس الخريطة المحتوى الذي تريد فعلاً أن يُراجع، لا أن تتحول إلى قائمة ضخمة تضم صفحات لا قيمة لها أو لم تعد موجودة. لكن تذكر أن خريطة الموقع لا تعالج بمفردها مشكلة الفوضى في بنية العناوين.
الخطوة الثالثة هي تحسين التحميل والاستجابة. جوجل تذكر صراحةً أنه إذا أمكنها تحميل الصفحات وعرضها بشكل أسرع، فقد تتمكن من قراءة مزيد من المحتوى على موقعك. وهذا لا يعني أن أي تحسين سرعة سيؤدي تلقائياً إلى زيادة الميزانية، لكنها توضح أيضاً أن مشاكل التوفّر والبطء تمنع Googlebot من الزحف بالمعدل الذي يريده. لهذا السبب، ليست السرعة هنا مجرد عامل UX أو Core Web Vitals، بل عنصر من عناصر كفاءة الزحف نفسها.
الخطوة الرابعة هي التعامل الصحيح مع الصفحات المحذوفة. إذا أزلت صفحة نهائياً، توصي جوجل بإرجاع رمز الحالة 404 أو 410 بدلاً من إبقائها في حالة ملتبسة. جوجل لن تنسى عنوان URL الذي رأته سابقاً فوراً، لكن هذه الرموز تعد إشارة واضحة إلى أن الصفحة لم تعد موجودة، ما يساعد على تنظيم الزحف مستقبلاً بشكل أفضل.
الخطوة الخامسة هي مراجعة ما إذا كان موقعك يستهلك جزءاً كبيراً من الزحف على موارد غير أساسية. تشير جوجل إلى أن الموارد اللازمة لعرض الصفحة تدخل أيضاً في الحساب، وأن تقليل الموارد غير الضرورية أو التعامل بحذر مع تغيّر عناوين الموارد قد يساعد في الحفاظ على ميزانية الزحف. لكنها تحذر في الوقت نفسه من حظر الموارد المهمة مثل JavaScript وCSS لأن ذلك قد يضر بفهم الصفحة وعرضها.
ما الفرق بين تحسين الزحف وتحسين الفهرسة؟
هذا الفرق حاسم. تحسين الزحف يعني أن تساعد جوجل على الوصول إلى الصفحات المهمة بكفاءة أعلى وبمعدل مناسب. أما تحسين الفهرسة فيتعلق بما إذا كانت الصفحة، بعد الزحف، تستحق الدخول إلى الفهرس. لذلك لا يجوز افتراض أن كل صفحة زُحف إليها ستُفهرس، ولا أن كل صفحة فُهرست ستحتل ترتيباً جيداً. جوجل تذكر بوضوح أن كل صفحة يتم الزحف إليها لا تُفهرس بالضرورة، لأن هناك مرحلة تقييم لاحقة تحدد إن كانت الصفحة مناسبة للفهرس.
هنا يظهر التداخل بين الجانب التقني والتحريري. قد تنجح في جعل جوجل تزحف إلى الصفحة، لكن الصفحة نفسها لا تضيف جديداً، أو تبدو مكررة، أو لا تخدم نية واضحة، أو لا تستحق الأولوية مقارنة بصفحات أخرى. لهذا السبب لا ينفصل ملف ميزانية الزحف عن تحسين المحتوى الداخلي ولا عن جودة كتابة محتوى المواقع وصفحات الهبوط. فالموقع الكبير الذي ينشر صفحات كثيرة ضعيفة أو متشابهة لن يحل مشكلته فقط بتعديل robots.txt أو الخادم.
ما الأخطاء الشائعة عند التعامل مع ميزانية الزحف؟
أكثر خطأ شائع هو أن يتعامل أصحاب المواقع مع ميزانية الزحف كأنها مشكلة كل موقع تلقائياً. بينما جوجل تقول بوضوح إن كثيراً من المواقع لا تحتاج أصلاً إلى القلق بهذا المستوى، ما دام الزحف إلى الصفحات المهمة يحدث في وقت مناسب. الخطأ الثاني هو محاولة اللعب بملف robots.txt على أمل نقل الزحف من قسم إلى آخر مؤقتاً، وهذا ليس ما توصي به جوجل. والخطأ الثالث هو الظن أن noindex أو حذف الروابط الخارجية وحدهما يحلان المشكلة، بينما الواقع أكثر تعقيداً.
الخطأ الرابع هو إهمال العلاقة بين البنية والتحرير. أحياناً يكون الموقع ضخماً، لكن الجزء المؤثر من المشكلة ليس في الخادم فقط، بل في الكم الهائل من الصفحات المكررة أو شبه الفارغة أو الأرشيفات التي لا تضيف قيمة. في هذه الحالة، يصبح ترتيب البنية، وتحسين الصفحات الأساسية، وتقليص الصفحات الضعيفة أكثر فائدة من التركيز على مؤشر واحد داخل Search Console.
كيف ترتب أولوياتك قبل أن تحاول زيادة الزحف؟
الخطوة الأذكى ليست أن تسأل أولاً: كيف أزيد ميزانية الزحف؟ بل أن تسأل: هل عندي فعلاً مشكلة ميزانية زحف، أم أن عندي مشكلة بنية URL، أو صفحات مكررة، أو ضعف في الأولويات التحريرية، أو بطئاً تقنياً يحد من الزحف؟ عندما ترتب هذا التسلسل بشكل صحيح، يصبح العمل أوضح كثيراً: قلّل الضوضاء، حسّن الوصول، راجع الصفحات المهمة، ثم راقب الأثر. عندها فقط يصبح الحديث عن تحسين الزحف منطقياً ومبنياً على أساس، لا على افتراض.
تشمل الخدمات التي نقدمها في وورديان هي:
إذا كان لديك موقع كبير أو متجر أو أرشيف محتوى ضخم، ولا تعرف هل التأخير في اكتشاف الصفحات أو فهرستها سببه ميزانية الزحف فعلاً أم سبب آخر، فيمكنك التواصل مع وورديان أو حجز استشارة لمناقشة خطوتك التالية بناءً على ما يحتاجه موقعك فعلاً، لا على أساس عدد الصفحات وحده.
أسئلة شائعة
-
هل تحتاج المواقع الصغيرة إلى القلق بشأن ميزانية الزحف؟
في أغلب الحالات لا. جوجل توضح أن هذا الملف يهم أساساً المواقع الكبيرة جداً أو المواقع السريعة التغير أو المواقع التي تعاني من عدد كبير من الصفحات المكتشفة غير المفهرسة. أما المواقع الصغيرة التي تُزحف صفحاتها المهمة بسرعة معقولة، فالأولوية فيها تكون عادةً للبنية والجودة والربط الداخلي.
-
هل زيادة موارد الخادم تعني زيادة ميزانية الزحف مباشرة؟
ليس دائماً. جوجل تذكر أن زيادة موارد الخادم قد تساعد إذا كان سبب بطء الزحف هو سعة الخادم من جهتك، لكنها توضح أيضاً أن تحسين التوفّر لا يؤدي بالضرورة وحده إلى زيادة الميزانية، لأن معدل الزحف النهائي يتحدد أيضاً بحسب طلب الزحف.
-
هل robots.txt أفضل من noindex للتحكم بميزانية الزحف؟
إذا كان هدفك منع الزحف إلى صفحات لا تريد لجوجل أن يزحف إليها أصلاً، فإن robots.txt هو الخيار الأقرب لذلك. أما noindex فلا يمنع الزحف نفسه، لأن جوجل تحتاج إلى زيارة الصفحة أولاً حتى ترى الإشارة. ولهذا لا يُستخدم noindex كوسيلة مباشرة لتقليل استهلاك الزحف.
-
هل صفحات 404 تهدر ميزانية الزحف؟
ليس بالشكل الذي يتصوره كثيرون. جوجل توضح أن صفحات 4xx العادية، باستثناء بعض الحالات مثل 429، لا تُعد هدراً مباشراً للميزانية. لكن الإشكال الأكبر يكون في صفحات soft 404 أو الصفحات الملتبسة التي تستمر جوجل في محاولة فهمها رغم أنها لا تحمل قيمة فعلية.
-
متى أحتاج إلى جهة متخصصة لمعالجة هذا الملف؟
عندما يصبح الموقع كبيراً بما يكفي، أو عندما تتكرر المشكلة عبر أقسام كاملة من الموقع، أو عندما لا تعرف هل الخلل الحقيقي في البنية أم الفهرسة أم جودة الصفحات نفسها. في هذه المرحلة يبدأ كثير من الفرق بالبحث عن شركة سيو في الخليج تستطيع قراءة المشكلة كمنظومة كاملة، لا كأرقام منفصلة داخل التقارير.