Парсер SERP /дестоп или онлайн

**Гендальф Серый** · 27.03.2018 14:43

Привет, народ. Вот ТЗ:

Это может быть сервис, либо софт, не важно.

На входе подаётся таблица с двумя столбцами: в одном столбце урлы, во втором столбце ключевые слова.

На входе мы должны получить данные:
1. Количество вхождений каждого ключа в каждый документ из урла
2. Количество символов в тексте каждого документа из урла
3. Количество слов в тексте каждого документа из урла
4. Среднее количество вхождений в первых 3, 5, 10 урлах на каждый отдельный ключ
5. Среднее количество текста в символах в первых 3, 5, 10 урлах
6. Среднее количество слов в тексте в первых 3, 5, 10 урлах.

Самое важное: п.1, п. 2

Особая сложность - ключи нужно считать не через код сайта, а как-то компилировать документ, чтобы мы видели и анализировали только то, что видит сам пользователь.
Например, нам нужно посчитать, скольлко раз символ "=" встречается в тексте на странице: https://ru.wikipedia.org/wiki/%D0%97...82%D0%B2%D0%B0

В тексте самого домента знак встречается 13 раз. Но если мы напишем примитивный парсер, который будет выкачивать код, то получим количество вхождений 1167. В этом основная сложность.

Кроме всего этого, парсер должен дружить с юникодом и не пугаться ни русского, ни тайского, ни китайского языков.

Вот пример таблицы - там два листа: что на входе и что на выходе.

**Vgb** · 27.03.2018 18:21

а чем вам мегаиндекс, который ком не устраивается под эти нужды?

**Гендальф Серый** · 27.03.2018 19:20

Vgb, можно подробнее? Где там и что смотреть?

	27.03.2018 14:43 #1
Гендальф Серый You shall not pass. Ага. Регистрация: 02.02.2013 Сообщений: 1,184 Репутация: 1513 Webmoney BL: ?	Привет, народ. Вот ТЗ: Это может быть сервис, либо софт, не важно. На входе подаётся таблица с двумя столбцами: в одном столбце урлы, во втором столбце ключевые слова. На входе мы должны получить данные: 1. Количество вхождений каждого ключа в каждый документ из урла 2. Количество символов в тексте каждого документа из урла 3. Количество слов в тексте каждого документа из урла 4. Среднее количество вхождений в первых 3, 5, 10 урлах на каждый отдельный ключ 5. Среднее количество текста в символах в первых 3, 5, 10 урлах 6. Среднее количество слов в тексте в первых 3, 5, 10 урлах. Самое важное: п.1, п. 2 Особая сложность - ключи нужно считать не через код сайта, а как-то компилировать документ, чтобы мы видели и анализировали только то, что видит сам пользователь. Например, нам нужно посчитать, скольлко раз символ "=" встречается в тексте на странице: https://ru.wikipedia.org/wiki/%D0%97...82%D0%B2%D0%B0 В тексте самого домента знак встречается 13 раз. Но если мы напишем примитивный парсер, который будет выкачивать код, то получим количество вхождений 1167. В этом основная сложность. Кроме всего этого, парсер должен дружить с юникодом и не пугаться ни русского, ни тайского, ни китайского языков. Вот пример таблицы - там два листа: что на входе и что на выходе. VPN для самых важных нужд, только для своих (не уносите ссылку) вот здесь.
0 Гендальф Серый

	27.03.2018 18:21 #2
Vgb Опытный Регистрация: 27.11.2013 Сообщений: 321 Репутация: 38	а чем вам мегаиндекс, который ком не устраивается под эти нужды? seofuck.ru
0 Vgb

	27.03.2018 19:20 #3
Гендальф Серый You shall not pass. Ага. Регистрация: 02.02.2013 Сообщений: 1,184 Репутация: 1513 Webmoney BL: ?	Vgb, можно подробнее? Где там и что смотреть? VPN для самых важных нужд, только для своих (не уносите ссылку) вот здесь.
0 Гендальф Серый

Темы	Раздел	Ответов	Последний пост
Где найти простенький ЯНдекс каталог парсер и функциональный парсер выдачи Яндекса.	Софт, скрипты, сервисы	3	04.12.2012 22:01
Уникальный (6 in 1) парсер зарубежных онлайн-магазинов	Софт, скрипты, лицензии	3	15.07.2012 16:26
парсер.рф - онлайн мониторинг позиций Вашего сайта, 5000 рублей - подарок для пользователей форума webmasters!	Реклама партнерских программ	71	16.06.2012 20:14
парсер.рф - онлайн мониторинг позиций Вашего сайта, 5000 рублей - подарок для пользователей форума webmasters!	Софт, скрипты, сервисы	34	07.03.2012 11:29
DatacolSEO v2.0 = SEO чекер, парсер обратных ссылок, парсер выдачи и ключевиков	Софт, скрипты, сервисы	6	15.11.2011 14:40

Парсер SERP /дестоп или онлайн

Опции темы

Тэги топика:

Похожие темы

Где найти простенький ЯНдекс каталог парсер и функциональный парсер выдачи Яндекса.

Уникальный (6 in 1) парсер зарубежных онлайн-магазинов

парсер.рф - онлайн мониторинг позиций Вашего сайта, 5000 рублей - подарок для пользователей форума webmasters!

парсер.рф - онлайн мониторинг позиций Вашего сайта, 5000 рублей - подарок для пользователей форума webmasters!

DatacolSEO v2.0 = SEO чекер, парсер обратных ссылок, парсер выдачи и ключевиков

Тем:

Сообщений:

Пользователей:

Сейчас на сайте:

Вход

Сайт

Разделы

Прочее

Следите за нами

Витрина ссылок

У нас проходит

У кого попросить инвайт?

Золотые темы форума

Последние новости

Популярные темы

Информеры