Пожелание к функционалу: было бы круто, если бы для кластеров можно было бы находить средние значения/медианы по импортированным столбцам числового типа.
Tekinec, по-русски (кстати, образованное от относительного прилагательного русский с помощью приставки по- , пишется через дефис) тут все разговаривать и выражаться умеют. Слово "кластеризация", образованное от слова "кластер", можно заменить только синонимом "сектор", которое не совсем здесь подходит. Все Ваши "синонимы" не описывают процесса, который называется кластеризацией.
Спасибо за урок русского языка! Только при чём тут все? А как же, всё-таки, ещё буквально пару лет назад мы обходились без "кластеризации"? И даже слова такого не было в обиходе вплоть до олимпиады в Сочи! А теперь без кластеризации как без рук! (ОФФТОП, опять же!)
В последнем обновлении переработали экспорт, добавили 2 вкладки: первая содержит все фразы подряд без пропусков, что даёт возможность сортировки и фильтрации, вторая - содержит структуру с возможностью сворачивания категорий и групп.
500к запросов очень туго загрузились, а насчет их кластеризации сбор данных стопорнулся на 100 и все. Я так понимаю с большими объемами программу справится очень и очень не скоро, если вообще справится?
Полмиллиона - это круто. Максимум, что мы тестировали - это 153к. На таком объеме программа работала и после этого мы ещё проводили оптимизацию. Туго - в смысле долго? Какой вид импорта был? Сколько дополнительных полей было, если это был xlsx?
а насчет их кластеризации сбор данных стопорнулся на 100 и все.
Вы использовали 100 бесплатных запросов к xmlproxy.ru, по умолчанию настроен этот сервис. Зайдите в настройки и добавьте свои данные доступа к xml яндекса. Если у Вас своих лимитов нет, то можно собирать через тот же xmlproxy, 1000 запросов через них стоит 5 рублей.
Я так понимаю с большими объемами программу справится очень и очень не скоро, если вообще справится?
Теоретически должна справиться, т.к. оптимизация всех функций была дополнительно проведена. Практически - сказать не могу, тестируйте.
Вчера скачал прогу, хотел протестить, т.к. очень интересная тема для меня. Вчера толком не успел, только загрузил и начались данные качаться. Сегодня программа данные не собирает.. Это только у меня так? https://yadi.sk/i/F88KrhvKrVe76
xilgiz, судя по всему, только у Вас так. Проверьте настройки доступа к xml.yandex.ru, если через него собираете. Особенно обратите внимание на ip адрес, который нужно добавить в сервисе, если он у Вас динамический.
TbIKBA, этот вопрос задавался уже неоднократно, попробую ответить максимально развёрнуто.
1. У нас есть 2 алгоритма кластеризации: soft и hard, чем отличаются подробно описано в FAQ-е 2. Возможность использовать маркерные фразы 3. Гибкая настройка сбора топа (топ5, топ10...топ50) в связке с настройкой силы группировки позволяет подобрать уникальный алгоритм кластеризации именно под качество выдачи в Вашей тематике. 4. Возможность построить структуру сайта до выгрузки в эксель и получить на выходе такой файл 5. Ну и субъективно, можете посмотреть в отзывах, которые писали пользователи о своих ощущениях при сравнении с другими сервисами/софтом.
К тому же, Вы можете скачать демо-версию и протестировать. Она ограничена только экспортом, остальной функционал не ограничен.