dmg.shark Как бред если это реально так, раньше делал генерированный контент на сатах так они были в индексе около 1-2 месяцев и все.
- 23.08.2010 13:02
- 23.08.2010 13:29
- 23.08.2010 14:49
Тогда извиняюсь, видимо перепутал названия агс и бан.
- 23.08.2010 16:04
- 23.08.2010 16:44
Саты делались для продажи ссылок на них вот пример http://na4alnik.net/
- 24.08.2010 20:18
- 24.08.2010 20:27
А на что это тогда похоже?
- 09.09.2010 01:12
Поисковая машина - это попытка отразить адекватно некоторые процессы в Сети.
Яндекс не может "доверять" или "не доверять" просто так.
Если это генерированный бред, то невозможно будет построить семантическое ядро. Раз его нельзя построить, то и классифицировать подобный контент сложно ввиду омонимии.
В тоже время, они там прекрасно знают, что шизоиды(к примеру, Гегель, Ницше), большая часть из которых витает в областях науки и техники, в состоянии выдавать бред похлеще любого генератора, но с точки зрения человека, читателя - это может быть вполне нормальным текстом, даже полезным.
Но как поисковому боту самостоятельно определить качество текста? Косвенно по ссылкам. Если на него ссылаются и сумарный коофициент(pr) весьма приличен, можно попробовать снять омонимию посредством анкоров, а потом натравить бота с увеличенными весами для Байеса и уменьшенными для SVM - 09.09.2010 12:27
Эмм
Soeti, то есть если на генерированный контент ссылаются то он становится качественным уником? - 09.09.2010 13:23
Генерированный контент - это и есть уник.
Если на этот уник сошлется WSJ, Guardian - он будет как-то классифицирован и будет считаться трастовым.
В данном случае по анкорам - это верняк. Во всех остальных - может быть, а может и нет. Это очень сложный процесс.
Без ссылок какой-то коофциент трастовости, конечно, присваивается, к примеру, если контент лежит в пределах допустимой лексики по сравнению с эталоной базой. Тогда SVM отработает на ура.
Есть на Армаде чел Vitvirtual. Как-то он запёрся на Юмакс. Так чуваки с юмакса реально посчитали, что это Хрумером кто-то балуется. Он это долго пытался доказать, пока знакомые не подписались. А всё потому, что у него такая манера выражаться - длинные сложносочиненные прдложения, которые тяжло переварить с первого раза.
Тэги топика:
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Каким должен быть сайт, чтоб попасть в каталог Яндекса? | Поисковые системы | 37 | 22.10.2010 06:27 |
Iframe страничка должна отрываться в 1 окне | Вопросы от новичков | 0 | 26.07.2010 19:35 |
Короткий пост, длинный пост. Какой должна быть длина поста. | Дайджест блогосферы | 0 | 23.02.2010 02:56 |
Проверка статей на уникальность - чем? | Софт, скрипты, сервисы | 59 | 06.10.2009 23:35 |
Как Должна Быть Организована Сетка Фарма-Шопов | Прочее | 12 | 09.09.2009 17:33 |




