Термінова допомога студентам
Дипломи, курсові, реферати, контрольні...

Аналитика і легко корисна інформація

РефератДопомога в написанніДізнатися вартістьмоєї роботи

Поисковые системи сьогодні стали основний постачальник нових користувачів про всяк інтернет-ресурс, і веб-майстра це добре знають. Знають і закономірності попиту. Вебмастер, підтримуючий сайт працевлаштування, наприклад, в Санкт-Петербурзі, безумовно інформований, що запит робота зустрічається набагато частіше, ніж робота у Пітері. Але нечіткий однословный запит робота використовують не лише… Читати ще >

Аналитика і легко корисна інформація (реферат, курсова, диплом, контрольна)

Аналитика і легко корисна информация

Андрей Иванов.

Подготовка сайту для індексування в пошукових системах

Индексирующие пошукові системи — сьогодні основні постачальники нових відвідувачів на сайт. У той самий час алгоритми роботи пошуковців будь-коли публікуються, потім у розробників є всі підстави — боротьби з замусориванием пошуковців (пошукових спамом чи спамдексингом) забирає багато зусиль і коштів колективу будь-якого пошукового проекта.

Вопрос у тому, як відвідати першу сторінку результатів пошуку з профільних, тобто точно які належать до тематиці сайту, запитам, хвилює багатьох. Явний дефіцит популярної інформації по цій проблемі породив дуже багато домислів — про «чудодійних «методах, про «корумпованості «і «протекціонізмі «адміністрацій пошукових систем, «продають «і роздає вигідні місця своїм людям.

Опыт аналізу сайтів, власники яких випробовують проблеми з відвідуванням з пошукових систем, показує, що економічні причини, зазвичай, набагато простіше. Вони полягають у елементарної неінформованість розроблювачів і власників сайту про найпростіших правилах, які треба враховувати, щоб сайт був добре представлено пошукових системах.

Поисковые запити, й релевантность

Разумеется, у тому, щоб у сайт з пошукової машини прийшли відвідувачі, йому недостатньо просто бути присутнім на результатах пошуку. Необхідно потрапити до початок списку результатів поиска.

Критерии, від яких становище посилання сайт зі сторінок результатів пошуку, можна розділити на дві групи — текстові і нетекстові. З назв ясно, що текстові критерії - це характеристики текстового вмісту сторінки. Нетекстові критерияъи оцінюють зв’язку сторінки, та її текст у своїй ролі не играет.

Учет текстових критеріїв складає етапі створення сайту і тексту. Фундаментальна обізнаність із нетекстовыми параметрами можлива вже по тому, як сайт викладений у Мережа і подано на индексацию.

В працювати з индексирующими пошуковими системами слід пам’ятати, що командою до пошуку в пошуковику є пошуковий запит, запроваджений користувачем — слово, кілька слів, словосполучення, фраза.

Здесь виникає досить суттєвий значеннєвий (семантичний) розрив. Про те, що відбувається у голові користувача, розвідувач і не відповідає, а користувача не існують поняття «правильного «і «неправильного «запросов.

Поэтому завжди до того, як планувати сайт, стоїть ознайомитися про те, як вони часто й в жодній формі користувачі насправді запитують інформацію, ймовірний до розміщення в Интернете.

В Рунеті із єдиним джерелом достовірних даних про пошукових запитах є сервісна служба системи рекламних оголошень «Яндекс-Директ » .

Текстовые критерії релевантности

Сегодня можна повністю забути таке застаріле поняття, як «ключові слова ». Спочатку ключовими називалися слова, внесені до особливе полі сторінки, датоване тегом. Але сьогодні пошукові системи ігнорують зміст цього поля. Щоб уникнути різночитань, ми взагалі відмовимося від використання цього термина.

Результаты пошуку визначаються, перш всього пошукових запитом; тому, коли мова далі про ключових словах і «соответствии-несоответствии «тексту сторінки запиту чи словами, завжди будуть матись у вигляді слова, із яких складається пошуковий запрос.

1. Титульна фраза Титульная фраза (титул) — це текст, що міститься сторінка в дескрипторі title, в коді сторінки він оформляється як Титульна фраза. Слова титульної фрази мають дуже велике значення при упорядочивании (ранжируванні) результатів пошуку пошукової системі. Як-от, якщо формулювання запиту збігаються з титульної фразою, або титульна фраза містить кілька слів запиту, то сторінка з таким титулом за інших рівних умов виявиться выше.

Стоит відзначити суперечливий статус титульної фрази, став причиною найбільш грубих помилок багатьох вебмастеров.

Титульная фраза не відображається сторінка сайту в браузері. Точніше, відображається, але рамці вікна браузери, тобто у місці, куди зазвичай хто б дивиться. Саме тому настільки поширена помилка, коли вебмастер ставить всім сторінок сайту однаковий титул. Зазвичай буває саму назву сайту, що дуже коректно виглядає, коли сайт, наприклад, показується заказчику.

Но коли сайт подається на індексацію в пошукові системи, картина змінюється, так як і результатах пошукових систем зміст тега відображається в найцікавіше місці - як заголовок знайденою сторінки! Саме титульна фраза сторінки є найяскравішим елементом списку результатів пошуку по пошуковому запиту. Вона грає своєї ролі - заголовка, «особи «сторінки. І користувача більш як наполовину визначається точністю, зрозумілістю і привабливістю титула.

Таким чином, можна вивести перші правила підготовки сайту до індексації пошуковими машинами:

1. Усі сторінки сайту повинен мати різні титулы.

2. Титульна фраза кожної сторінки має бути точною і ясной.

3. Зміст сторінки має відповідати титулу.

4. У титульної фразі сторінки би мало бути слова, часто які в пошукових запитах користувачів, відповіддю куди може бути дана страница.

5. Марно використовувати титульні фрази довжиною понад 80 символів.

2. Опис страницы Описание сторінки — це зміст поля, позначеного тегом meta description, оформляється як. Слова описи звичайно впливають на ранжування результатів пошуку, серед російських пошукових систем даний ярлик використовується практично лише «Яндексом ». Проте «Яндекс «зараз — провідна система, і грамотно складати опис навіть у розрахунку лише на «Яндекс «цілком целесообразно.

Текст описи показується в результатах пошуку «Яндекса «під текстом титульної фрази. Отже, правильно оформивши титул і опис, можна досягти максимальної привабливості посилання вашу сторінку в «Яндексе ». Це спрацьовує, коли користувач, отримавши відповідь, вибирає з кількох альтернатив.

К жалю, більшість вебмастеров нехтують такий можливістю поліпшити зовнішній вигляд (зрозумілість) своїх посилань в пошуковику, ставлячи на змалювання всіх сторінок сайту те ж фразу, або взагалі ігноруючи це поле.

Но в ідеалі потрібно… Сформулюємо чергові правила:

6. Описание всіх сторінок сайту в теге мали бути зацікавленими разными.

7. Опис кожної сторінки має відповідати її содержанию.

3. Інші текстові критерии Поисковые машини використовують також такі текстові критерії релевантности знайдених сторінок запиту:

позиция знайдених слів в титульної фразі;

" вагу «знайденого слова близькість його до початку документа;

наличие знайдених слів в заголовках (, тощо. буд.) і фрагментах, виділених жирним шрифтом (,);

близость знайдених слів друг до друга (компактність цитати).

Объясним, що мається на увазі під «найдеными словами ». Индексирующие пошукові системи засновані ідеї пошуку «цитати ». Припускається, що користувач хоче документ, у якому слова, введені як запиту. Пошуковик знаходять у своєму індексі такі документи видає їх адреси. У перелічених вище критеріях «знайдене слово «- це слово, те що як у веб-сторінці, і у пошуковому запиті, яким мусить бути показано посилання цю веб-сторінку.

С зростанням кількості документів мають у Мережі дедалі гостріше ставала проблема ранжирування посилань, видавали поисковиками у відповідь запити користувачів. Їх стало занадто багато. Тому розробники стали одна одною вводити критерії, дозволяють хіба що «уточнити «релевантность сторінки — ступінь його відповідності документа запросу.

Если у документі йдеться якесь предметі, теоретично, цей предмет повинен часто згадуватися (називатися), тобто. частота слова — назви предмета буде підвищеної. Цей параметр називається «вагою «слова.

Авторы текстів знають, що головну ідею матеріалу найкраще виносити на початок тексту, тому деякі пошукові системи становище знайденого слова стосовно початку документа стали також приймати за критерій релевантности.

Положение слів щодо одне одного, особливо у титулі, є також критерієм. У разі пошукових запитів, які перебувають з понад слова, справедливо припущення (пригадаємо основну ідею индексирующих пошуковців), що користувач шукає цитату, тобто саме входження введеного словосполучення. Можливо, в запиті і пропущені деякі слова, але у будь-якому разі порядок слів та духовна близькість їх одне до друга важливі. Наприклад, в запиті крокви теслі легко впізнається назва повісті Селінджера «Вище крокви, теслі! », а теслі крокви нагадують вже про Бродського («підняти не звали тесль крокви »). Така компактність цитати добре розпізнається пошуковими системами.

Почему критерієм релевантности використовується наявність слів запиту в виділених фрагментах і заголовках документа, очевидно: саме так творці текстів виділяють найважливіші слова, куди хочуть звернути внимание.

Как бачимо, все текстові критерії ранжирування успіхів у пошукових системах мають прості логічні пояснення. Розробники пошукових систем ранжируют сторінки, виходячи з того, що веб-майстра створювали міні-Фатахів та структурували в розрахунку «живих «посетителей.

Распределение частот пошукових запитів. Веб-майстра і пошукові системи. Спамдексинг Поисковые запити повторюються. Різні в різних містах, у різний час й у різні пошуковики вводять одні й самі пошукові запити: робота, чат, секс, mp3, windows, линукс та інших. Частоту використання кожного запиту можна визначити. Деякі зустрічаються загалом разів на тиждень, а і такі, що щодня повторюються в сотні разів. Чим довші запит, тим рідше він зустрічається. І навпаки, найбільш частотним запитом із групи, що належить до будь-якої темі, завжди є найбільш загальний запит — один голос чи словосполучення, що б тему.

Поисковые системи сьогодні стали основний постачальник нових користувачів про всяк інтернет-ресурс, і веб-майстра це добре знають. Знають і закономірності попиту. Вебмастер, підтримуючий сайт працевлаштування, наприклад, в Санкт-Петербурзі, безумовно інформований, що запит робота зустрічається набагато частіше, ніж робота у Пітері. Але нечіткий однословный запит робота використовують не лише пітерці, а й москвичі, новосибірці, казанцы… Тому вебмастерам сайтів із працевлаштування кожного з міст хочеться відвідати першу сторінку пошуку саме з «головному «однословному запиту. Але міст багато, але в першій сторінці результатів може розміститися лише 15−20 ссылок.

С метою покращити своє позицію у результатах пошуку веб-майстра застосовували і дотримуються низки технічних прийомів, призначених саме з обману, «накручування «пошукового робота. Явище це і називається спамом пошукових систем чи спамдексингом (від spam + indexing) і з’явився практично разом з появою поисковиков.

Так як останні раніше використовували лише текстові критерії для ранжирування результатів, то типовим прийомом спамдексинга стала так звана «накачування «- штучне завищення частот (терезів) потрібних слів на странице.

Варианты «накачування «використовувалися найрізноманітніші: від примітивного «прихованого », невидимого звичайному користувачеві тексту, аж до створення спеціальних текстів, де ваги слів старанно розраховувалися відповідно до значеннями, снимаемыми зі шпальт, котрі посідають перші позиції у посиланнях по необхідним запросам.

Накачиваются самі сторінки, титульні фрази, теги noframes і keywords. Спеціально створюються сторінки з цими «оптимизированными для пошуковців «текстами, потрапляючи куди, користувач автоматично перекидається в інший сайт. Або просто бачить велику напис «Вхід ». Вони і називаються — вхідні сторінки. Понад те, розроблена спеціальна техніка (клоакинг), коли пошуковому роботу показується одну сторінку, а користувачам — цілком другая.

Подобные дії є бичем пошуковців, оскільки сильно перевантажують індекси, спотворюють зовнішній вигляд сторінок із результатами пошуку це й різко знижують релевантность системи, тобто підвищення якості і його конкурентна перевага у боротьбі популярність коїться з іншими поисковиками.

История пошуковців є історія їх постійної боротьби з спамом. Зовсім недавно пошуках зброї проти текстовій «накачування «пошуковики почали доповнювати текстові алгоритми ранжирування результатів пошуку нетекстовыми критеріями — а саме, ссылочными.

Нетекстовые критерії релевантности

Нетекстовые критерії можна розділити втричі основних типи. Ми надаємо умовні назви, так як усталеної термінології ми маємо:

ссылочно-расчетные,.

ссылочно-текстовые,.

каталожные.

Как ми вже казали, у разі нетекстового критерію на ранжування сторінки впливає не неї давав, інші факторы.

Ссылочно-расчетные критерії. До ссылочно-расчетным критеріям належить алгоритм пошукової системи Google — так званий зважений індекс цитування PageRank (PR). Детальна стаття про неї Кріса Райдингса (переклад і коментар А. Садовського) є з сайту Олександра Садовського internet.

Индекс цитування враховує, як багато посилань є у Мережі на ваш сайт, і, як авторитетні посилаються на вас сайти. Авторитетність «цитування «визначається також за кількістю посилань на «цитирующего ». Для розрахунку індексу цитування Google і такі органи системи регулярно «перетряхивают «неймовірно величезні матриці перетинів поміж сайтами Інтернету, перераховуючи вагу заслань та авторитетність ресурсів (зауважимо, що Google використовує при цьому «ферму «з понад 10 000 серверів!). Такий алгоритм застосовується також «Яндексом » .

Каталожные критерії. До каталожным критеріям можна віднести індекс цитування «Яндекса «(citation index, CY) і алгоритм видачі результатів пошуку «Рамблера ». У обох випадках принцип один — нагорі результатів пошуку на запит в індексах видається кілька посилань на сайти, зареєстровані у що належать порталам тематичних каталогах. Що стосується «Яндекса «показується близько трьох посилань на сайти з каталогу «Яндекса », якщо в описі є слова запиту. Ранжування проводиться у разі спадаючій індексу цитування «Яндекса ». Каталожні заслання результатах пошуку «Яндекса «чітко від звичайних рахункових: де вони нумеруються, а відзначаються точками. Опис ресурсу в каталозі «Яндекса «перевіряється, а часто й складається вручну упорядниками каталогу (так званими модераторами). Індекс цитування, природно, розраховується автоматически.

В своє чергу, «Рамблер «» замішує «на першу сторінку результатів пошуку на запит до п’яти посилань на сайти, зареєстровані у каталоге-рейтинге Rambler «p.s Top100, якщо їх відвідуваність (по «хостам ») вище деякого мінімального порога. Критерієм внесення даних посилань до списку результатів пошуку служить наявність слів запиту в описі сайту, зроблене для Rambler «p.s Top100. На відміну від «Яндекса », де розмір описи обмежений двома сотнями символів, на індексацію в Rambler «p.s Top100 то, можливо подано опис розміром до 4000 символов.

При внесенні до рейтингу опис сайту він може перевірятися співробітником «Рамблера «- модератором рейтинга.

Ссылочно-текстовые критерії. До ссылочно-текстовым критеріям можна віднести алгоритм, нещодавно що з’явився «Яндексе ». У разі «Яндекс «індексує текст посилання (тобто текст, виділений як гіперпосилання, на сторінці сайту). Інакше кажучи, індексується вміст тега, і якщо запит збігаються з цим вмістом, в результатах пошуку видається адресу, вказаний у теге.

" Яндекс ", очевидно, запам’ятовує лише зовнішні посилання з сайтів, тобто сторінка, на якої вказує посилання, має належати сайту, де цей посилання размещена.

При цьому при показі результатів пошуку така сторінка немає титулу, і «Яндекс «супроводжує посилання неї явним зазначенням — «адресу знайдено по засланні «.

Спрос і пропозиції - точки зближення в пошукових системах

Поисковые запити є реальним вираженням попиту користувачів на інформацію в Інтернеті. Пропозиція інформації складає сторінках ресурсів Інтернету. Индексирующие пошукові системи сьогодні є незаперечним лідером трафикогенерации більшість сайтів і є природним з'єднувальною ланкою, що з'єднує попит предложение.

Как ми можемо вже показали, основу всіх текстових критеріїв пошукових систем лежить уявлення, що користувач шукає цитату з якогось документа. Насправді ж ділі це негаразд. Користувачі шукають не й з документів, а розв’язання своїх проблем — відповіді є питання, що вони навіть можуть точно сформулювати. Обговорення цього питання за межі предмета даної статті, наведемо лише одна з доказательств.

Вот воно: мову попиту радикально відрізняється від мови пропозиції. Характеристиками мови пропозиції (текстів сайту) у своїй є грамотність, літературна коректність, чіткість викладу думок. Цього цілком не можна сказати про мові попиту (мові запитів) — переважна більшість пошукових запитів належить до нечітким, т. е. допускає більше варіанта розуміння; запити часто занадто лаконічні, сповнені помилок, змішують кирилицю і латиницю і т.п.

Поисковикам нізвідки брати інформацію на свої індексів, інакше як зі шпальт, підготовлених вебмастерами. І беруть їх у рафінованому, літературному виде.

С з іншого боку, вебмастерам не вдасться навчити користувачів формулювати пошукові запити «як треба чинити », довгими гладенькими фразами на хорошому російському языке.

Поэтому першим кроком навіть підготовки сайту до індексації, яке розробки має бути вивчення того, як користувачі шукають у Мережі інформацію. Ту інформацію, яку власник сайту збирається пропонувати своєму ресурсе.

Технически цей аналіз здійснюється з допомогою отримання реальних формулювань запитів і інформацію про їх частотах, виділенні стійких напрямів попиту, базових формулювань і типових конструкцій пошукових запитів (докладніше звідси розказано у статті «Аналіз від попиту й підвищення видимості в пошукових машинах »).

Далее розробникам доведеться вирішувати, чого ж з'єднати вимоги, які пред’являються друкованому тексту, із необхідністю них слів і конструкцій, інформацію про яких була отримана шляхом аналізу пошукових запитів. Процес цей, на жаль, алгоритмизировать неможливо. Тут розробникам сайту доведеться вирішити невідь що складну, але важливу лінгвістичну завдання — спробувати описати свій бізнес не словами генеральний директор, веб-майстра чи відділу маркетингу компанії, а словами публики.

С чого начать

Наверное, статтю логічніше було б розпочати з кінця. Спочатку — вивчення попиту, потім створення текстів, потім — оформлення текстів з урахуванням текстових критеріїв ранжирування, потім оформлення описів сторінок для більшої привабливості посилань ними в пошукових системах, і потім — старт проекту й початок робіт з використання нетекстових критеріїв (розстановці заслань та пр.).

Действительно, це — найправильніший шлях. На проходження не вистачає часу, ресурсів немає і терпения.

Однако ми знову повторимо, основна маса помилок вебмастеров, знижують видимість сайту в пошукових системах, стосується не «корінних «завдань планування, і необізнаності в тонкощах побудови «ієрархічних », «циклічних «і «великих «систем зв’язування сторінок для оптимізації PageRank. І це над нездатності писати хитрі «вхідні сторінки », аби бути «забанеными «модераторами чи фільтрами пошукових машин.

Основная помилка банальна — це невміння працювати з титульними фразами і описами. Виправивши грубі помилки у титули і описах, можна, по-перше, значно розширити коло пошукових запитів, якими посилання сторінки сайту будуть показані на кращих позиціях. І, по-друге, надати своїм посилань в поисковиках гідний, привабливий зовнішній вигляд, викликає бажання клацнути по ним.

Начинать потрібно саме з этого.

Показати весь текст
Заповнити форму поточною роботою