Собственно всё чаще сталкиваюсь с работой с данными и не могу нормально реализовать две вещи:
1. Из списка сайтов удалять дубли (вместе с оригиналом!)
Из гугления из полезного нашел только DupKill.exe которая решает проблему
2. Из списка оставить только дубли, а остальные удалить
Пока ничего не нашел.
Понимаю что в excel и notepad++ должны быть решения в виде макросов и формул, но не нашел именно под эти задачи. Посоветуйте сервис/способ/ссылку где почитать решение. Желательно чтобы обе задачи решались в пределах одного сервиса/проги. Рано или поздно я его найду, но может кто готовым поделится. Заранее спасибо.
- 04.10.2014 23:41
- 05.10.2014 13:59
В Excel можно почитать на офф.сайте:
Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
Небольшой обзор программ:Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
Надеюсь, найдете для себя полезное
Если использовать бесплатный текстовый редактор Notepad++.
Делается это все в два клика.
1. Итак открываем ваш текстовый документ
2. Выделяем весь текст
3. Идем в меню TextFX -> TextFX Tools -> Sort lines case insensitive
При этом опция “Sort outputs only UNIQUE lines” должна быть ВКЛЮЧЕНА
Вот и все – получаем отсортированные строки без повторов и дублей.Последний раз редактировалось gosware; 05.10.2014 в 14:07.
Спасибо сказали:
Norder(05.10.2014), - 05.10.2014 14:14
gosware, спасибо, но я не просто так указал что мне нужно удалять дубли включая оригинал, поэтому последний совет точно не помогает. А предыдущие два посмотрю
upd. И первый тоже мимо. А вот программа bvsDupDelet по второй ссылке решает обе мои задачи. За что спасибо еще раз.
По факту тему можно закрывать, т.к. решение найденоПоследний раз редактировалось Norder; 05.10.2014 в 14:24.
Похожие темы
Темы | Раздел | Ответов | Последний пост |
---|---|---|---|
Как правильно поступить с имеющимися дублями | Общие вопросы поисковой оптимизации | 1 | 16.02.2015 01:47 |
Борьба с дублями в пагинации | Общие вопросы поисковой оптимизации | 4 | 03.03.2013 21:52 |
Добавление значений в БД - ошибка | Web программирование | 3 | 11.09.2012 00:20 |
Будет ли это дублями страниц? | Вопросы от новичков | 10 | 01.07.2012 14:54 |
Считать ли дублями страницы со слешем и без? | Вопросы от новичков | 5 | 14.05.2012 23:00 |