Есть список ключевых слов. Среди них есть дубликаты (полные совпадения строк).
Нужно найти те строки у которых есть дубликаты и вывести их отдельным списком. В идеале, чтобы еще было указано сколько раз данное ключевое слово встречается в основном списке.
Сами по себе дубликаты удалить не проблема, проблема их посчитать.
Как бы вы решили такую задачу?
- 25.07.2013 23:30
- Регистрация: 17.01.2007
- Сообщений: 35
- Репутация: 15
- 25.07.2013 23:35
Отсортируй в екселе и посчитай выделением
Спасибо сказали:
se_home(25.07.2013), - 25.07.2013 23:49
- Регистрация: 17.01.2007
- Сообщений: 35
- Репутация: 15
Pirat, а можно подробней? Я так понял, отсортировать по алфавиту в экселе? И как посчитать выделением? Вручную не подходит, ключевых слов сотни тысяч.
- 25.07.2013 23:54
se_home, в экселе есть опция - удалить дубликаты
Скрытый текст (вы должны зарегистрироваться или войти под своим логином):У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
У меня 2013 версия, но во всех предыдущих тоже есть во вкладке "Данные"Спасибо сказали:
se_home(26.07.2013), - 26.07.2013 00:04
- Регистрация: 17.01.2007
- Сообщений: 35
- Репутация: 15
OKyJIucT, интересная возможность экселя, не знал. Но все таки требуется другое. Нужно не удалить, а наоборот вывести ТОЛЬКО дубликаты, и желательно самые популярные дубликаты вверху списка, т.е. посчитать сколько раз дубликаты встречаются в изначальном списке.
- 26.07.2013 14:43
se_home,
1. Залить строки в таблицу базы данных.Нужно найти те строки у которых есть дубликаты и вывести их отдельным списком. В идеале, чтобы еще было указано сколько раз данное ключевое слово встречается в основном списке.
А затем запросом
select count(*),text from text_table
group by text
можно будет подсчитать дубли и " вывести их отдельным списком"
2. поискать в инете скрипт - который считает дубли в текстовом файле
у меня есть такой скрипт - но он несколько иным занимается - он чистить исходный файл от дублей.
Т.е. ему на вход - файл с дублями . А на выходе получаем два файла - с кникальным текстом и файл дублей.Спасибо сказали:
se_home(26.07.2013), - 26.07.2013 21:23
se_home,
Да Эксель мощщная программа. Если ее знаешь и тем паче знаешь VBA - то можно с ним чудеса творить.
А я вот как-то по старенькому - через SQL такие задачи решаю. - 27.07.2013 01:29
se_home, пишите в пм, напишем вам решение.
Если вы программист - то я бы на Java решил с помощью HashMap - ключ - словосочетание, значение - количество раз, которое оно встречается. - 30.07.2013 23:51
- Регистрация: 30.07.2013
- Сообщений: 30
- Репутация: 0
есть специальные плагины для антидублей, например на опенкарте часто использую.
Похожие темы
Темы | Раздел | Ответов | Последний пост |
---|---|---|---|
Новая русская база ключевых слов Пастухова - 1,655,810,672 слов | Базы сайтов, каталогов | 26 | 31.05.2017 17:40 |
Парсинг ключевых слов | Бесплатное на форуме | 209 | 08.03.2014 17:26 |
Бесплатный парсинг ключевых слов, увеличиваю лимит до 5 слов в день. | Бесплатное на форуме | 42 | 30.11.2012 14:12 |
Конкуренция ключевых слов | Вопросы от новичков | 7 | 26.11.2012 23:42 |
Анализ ключевых слов. | Услуги по SEO | 0 | 20.04.2012 11:36 |