Как выявить дубликаты в списке ключевых слов

(Ответов: 9, Просмотров: 2821)
  1. Студент
    • Регистрация: 17.01.2007
    • Сообщений: 35
    • Репутация: 15
    Есть список ключевых слов. Среди них есть дубликаты (полные совпадения строк).

    Нужно найти те строки у которых есть дубликаты и вывести их отдельным списком. В идеале, чтобы еще было указано сколько раз данное ключевое слово встречается в основном списке.

    Сами по себе дубликаты удалить не проблема, проблема их посчитать.

    Как бы вы решили такую задачу?
    • 0
  2. Опытный Аватар для Pirat
    • Регистрация: 20.09.2012
    • Сообщений: 251
    • Репутация: 53
    Отсортируй в екселе и посчитай выделением
    • 1

    Спасибо сказали:

    se_home(25.07.2013),
  3. Студент
    • Регистрация: 17.01.2007
    • Сообщений: 35
    • Репутация: 15
    Pirat, а можно подробней? Я так понял, отсортировать по алфавиту в экселе? И как посчитать выделением? Вручную не подходит, ключевых слов сотни тысяч.
    • 0
  4. Sunshine reggae Аватар для OKyJIucT
    • Регистрация: 02.09.2011
    • Сообщений: 3,240
    • Репутация: 1830
    • Webmoney BL: ?
    se_home, в экселе есть опция - удалить дубликаты
    Скрытый текст (вы должны зарегистрироваться или войти под своим логином):
    У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.

    У меня 2013 версия, но во всех предыдущих тоже есть во вкладке "Данные"
    • 1

    Спасибо сказали:

    se_home(26.07.2013),
  5. Студент
    • Регистрация: 17.01.2007
    • Сообщений: 35
    • Репутация: 15
    OKyJIucT, интересная возможность экселя, не знал. Но все таки требуется другое. Нужно не удалить, а наоборот вывести ТОЛЬКО дубликаты, и желательно самые популярные дубликаты вверху списка, т.е. посчитать сколько раз дубликаты встречаются в изначальном списке.
    • 0
  6. Опытный Аватар для treeclimber
    • Регистрация: 08.06.2012
    • Сообщений: 403
    • Репутация: 47
    se_home,
    Нужно найти те строки у которых есть дубликаты и вывести их отдельным списком. В идеале, чтобы еще было указано сколько раз данное ключевое слово встречается в основном списке.
    1. Залить строки в таблицу базы данных.
    А затем запросом
    select count(*),text from text_table
    group by text
    можно будет подсчитать дубли и " вывести их отдельным списком"
    2. поискать в инете скрипт - который считает дубли в текстовом файле

    у меня есть такой скрипт - но он несколько иным занимается - он чистить исходный файл от дублей.
    Т.е. ему на вход - файл с дублями . А на выходе получаем два файла - с кникальным текстом и файл дублей.
    • 1

    Спасибо сказали:

    se_home(26.07.2013),
  7. Студент
    • Регистрация: 17.01.2007
    • Сообщений: 35
    • Репутация: 15
    treeclimber, скриптов или программ именно под такую задачу как-то не нашлось с ходу.

    Пока самый простой вариант такой придумал:
    В Экселе: Условное форматирование => Создать правило => Форматировать только уникальные или повторяющиеся значения
    Нажмите на изображение для увеличения.  Название:	for.jpg  Просмотров:	5  Размер:	41.1 Кб  ID:	10850
    Не считает, зато выделяет. Хотя бы так. Отсортировать по алфавиту и получается более-менее нужное.
    • 0
  8. Опытный Аватар для treeclimber
    • Регистрация: 08.06.2012
    • Сообщений: 403
    • Репутация: 47
    se_home,
    Да Эксель мощщная программа. Если ее знаешь и тем паче знаешь VBA - то можно с ним чудеса творить.
    А я вот как-то по старенькому - через SQL такие задачи решаю.
    • 0
  9. Дипломник Аватар для kik11
    • Регистрация: 03.01.2013
    • Сообщений: 218
    • Репутация: 43
    se_home, пишите в пм, напишем вам решение.
    Если вы программист - то я бы на Java решил с помощью HashMap - ключ - словосочетание, значение - количество раз, которое оно встречается.
    • 0
  10. Студент
    • Регистрация: 30.07.2013
    • Сообщений: 30
    • Репутация: 0
    есть специальные плагины для антидублей, например на опенкарте часто использую.
    • 0

Похожие темы

Темы Раздел Ответов Последний пост
Новая русская база ключевых слов Пастухова - 1,655,810,672 слов
Базы сайтов, каталогов 26 31.05.2017 17:40
Парсинг ключевых слов
Бесплатное на форуме 209 08.03.2014 17:26
Бесплатный парсинг ключевых слов, увеличиваю лимит до 5 слов в день.
Бесплатное на форуме 42 30.11.2012 14:12
Конкуренция ключевых слов
Вопросы от новичков 7 26.11.2012 23:42
Анализ ключевых слов.
Услуги по SEO 0 20.04.2012 11:36

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры