Интернэт, Блог
Google-ийн индекс нь сайтад эсвэл түүний хэсэг дээр хэрхэн арилгах
Google-баталсан индексжүүлэх үзэл баримтлалын дагуу, мэдээлэл, үр дүнг гаргах нь хайлтын хүсэлтийн өөрийн тохирлын бодитой бүрэн бүтэн эзэлж байна. индекс спам хууль бус агуулга буюу нөөц нь вэб унасан бол энэ сайтын хуудсууд нийтийн мэдээллийн санг хайлтын систем тэмдэглэгдсэн байх болно. бидэнд сурах нь чухал юм сайтыг хэрхэн арилгах хайлт сервер үр дүнг гаргах нь.
тэг индексжүүлэх Google-ийн хувилбарууд
Шинэ нөөц-ий тухай мэдээлэл цуглуулах хөтөлбөр - - хайлтын роботын дараа хуудсаар сайт хуудсыг скан болно, дараа нь ийм салгалт хийх нь Google-ийн бодлого шаардлагын дагуу, энэ нь индексжүүлсэн үед болно. индекс, ижил цаг буудал дээр хайх - Гэхдээ бид ч бас хэрхэн robots.txt дамжуулан хайлтын таны сайт эсвэл хэсэг дээр арилгахын тулд танд харуулж байна.
, Бүхэлд нь нөөцийн гаргах оруулахгүй байх нь дээр байрлаж байгаа сервер үндсэн фолдер дотор, тодорхой текст талбайг бий болгож байна - robots.txt хэлсэн байна. Энэ нь бүс уншиж зааврын дагуу хайлтын хөдөлгүүр нь эмчилж, үйлдэл юм.
Google-ийн хайлтын хөдөлгүүр индекс хуудас нь хэрэглэгчийн хандалтыг байсан ч гэсэн хориотой үзэхийн тулд гэдгийг санаарай. хөтөч 401 буюу 403 нь гэж хариулбал "Access хүчин төгөлдөр бус байна", энэ нь зөвхөн жуулчдад бус, харин энэ нь цуглуулах хөтөлбөр илүү хамаатай хайлтын систем.
ойлгохын тулд хэрхэн арилгах хайлтын индексжүүлэх нь сайтад, текст заагч дараах мөрүүдийг оруулна уу:
Хэрэглэгчийн агент: Googlebot
Хаах: /
Энэ нь газар дээр нь бүх агуулгын хориглох индекстэй гинжит заана. Энд юм сайтыг хэрхэн арилгах , Google Ингэснээр сүүлийн илэрсэн жагсаалтад нөөцийг хадгалж байна.
өөр протокол хайх нь Embodiments
Та гипертекст тус тусад нь бие даасан харилцаа холбооны стандарт, та жишээ нь, Google индексжүүлэх тусгай дүрмийг хэрэглэнэ хүсэж байгаа нь жагсааж хэрэгтэй бол протокол HTTP / HTTPS, энэ нь дараах байдлаар (жишээ нь) -д robots.txt-д бүртгүүлэх шаардлагатай байдаг.
(Http://yourserver.com/robots.txt) - Таны сайтын домэйн нэр (байгаа бол)
Хэрэглэгчийн агент: * - ямар нэг хайлтын систем
Зөвшөөрөх: / - бүрэн индексжүүлэлт боломж
асуудал нь бүрэн HTTPS протокол нь сайтад хэрхэн устгах
(Https://yourserver.com/robots.txt):
Хэрэглэгчийн агент: *
Хаах: индексжүүлэх дээр / бүрэн хориг
Google-ийн SERPs-аас Хурдасгасан зайлуулах URL- нөөцийн хаяг
Та дахин индексжүүлж хүлээх хүсэхгүй байна, хэрэв сайт нь та иймэрхүү нуухыг хүсэж байна, би аль болох хурдан үйлчилгээ http://services.google.com/urlconsole/controller ашиглахыг зөвлөж байна. Урьдчилсан robots.txt сайт серверийн эх санд байрлуулах ёстой байдаг. Энэ нь зохих зааврыг заасан байх ёстой.
Зарим нэг шалтгааны улмаас заагч эх сан дотор засварлах боломжгүй бол, та хайлтын нуугдах гэж хүсэж байгаа нь зорилт бүхий хавтас хангалттай бий. Та гипертекст хаягуудыг автоматаар арилгах үйлчилгээтэй энэ хийж, илгээх дараа Google-ийн robots.txt нь өө хайгч тусгасан хавтас скан болно.
Энэ үл үзэгдэгч хугацаа 3 сар тогтоосон байна. Энэ хугацааны дараа, асуудлыг нь буцаан сан, дахин Google-ийн сервер боловсруулсан болно.
хэсэгчлэн скан сайтыг устгах H OW
хайлтын BOT robots.txt агуулгыг уншиж байгаа үед энэ нь тодорхой шийдвэр түүний агуулга дээр үндэслэн хийсэн байна. нь та anatom хэмээх бүхэл бүтэн сан байгаа оруулахгүй хүсэж байна гэж үзье. Ийм зохицуулалтыг тодорхойлоход хангалттай юм:
Хэрэглэгчийн агент: Googlebot
Хаах: / anatom
Эсвэл, жишээ нь, та биш индекс бүх төрлийн зураг .gif хүсэж байна. Үүнийг хийхийн тулд дараах жагсаалтыг нэмнэ:
Хэрэглэгчийн агент: Googlebot
Хаах: /*.gif$
Энд бас нэг жишээ юм. индекс нэвтрэх төрөл нэмж байхад тэдэнд динамикаар үүсгэгдэх хуудсан дээр мэдээллийг магадлах нь устгагдах болно үзье:
Хэрэглэгчийн агент: Googlebot
Хаах: / *?
Энэ талаар юм, хайлтын журмыг гарч дэвшүүлсэн. Өөр нэг зүйл нь ердөө л энэ META хаягийг ашиглах нь илүү тохиромжтой байдаг юм. Тэгээд webmasters нь ихэвчлэн хайлтын үйл ажиллагааг зохицуулах л ийм стандартыг ашигладаг. Гэхдээ бид цаашид дугаар зүйлд энэ талаар хэлэлцэх болно.
Similar articles
Trending Now