Студент - Репутация: 11
- Webmoney BL: ?
| Для медицинских сайтов необходимо кластеризовать ядро по препаратам. Процесс: 1. Мы выдаем название препаратов; (Например геморрой, выдаем 50-60 препаратов, тематик много) 2. Вы собираете ключи с вордстата (1 итерация) 3. Удаляем стоп слова (рлс, купить) - это все; 4. Удаляем слова более 7и слов (Лупой не чекаем); 5. Собираем "!" частотность фраз; 6. Удаляем фразы с частотностью меньше 10; 7. Без удаление неявных дублей и других чисток разгруппировываем по препаратам. Нюансы: * На первом месте группы всегда главный ключ (название препарата); * Ключей в группе не более 50-70, остальной хвост просто удаляем; * Иногда приходится пересобрать отдельные препараты (почему-то не всегда собирается все как надо) Для тех, кому знаком и понятен процесс и они желают заработать. Пишите свои предложения по цене за группу и времени выполнения. icq: 497391717 skype: live:9152b7c99dba19e5 https://vk.com/id267756986 ЛС |