Имеется сайт на joomla c 15К+ количеством новостей. Сайт жутко тормозит, таблицы с ошибками, руководство приняло решение не лечить а менять CMS. Переезжаем с Joomla на processwire с новым дизайном и космической скоростью открытия всех страниц. Домен также перезжает, что чуть упрощает задачу.
Задача - перенести(экспортировать) все новости на новую CMS и сделать 301 редиректы на новые урлы нового домена. Директива host в robots.txt также будет меняться на новый домен.
По переносу компонентов БД MYSQL никто нигде пока полезного не подсказал, говорят крайне сложно.
Поэтому у меня идея - заказать какой то парсер-паук на PHP который пробежится по урлам из сайтмапа и скопирует определенные компоненты страницы на новые адреса + скачает на хост картинку каждой новости и зальет на новый сайт. Вопрос к знатокам, какое примерно ТЗ нужно составить для фрилансера?
По 301 редиректам - ума не приложу пока, логику их создания из за того что на старом сайте 2 вида урлов. Не пойму какой макрос нужен чтобы в ексель прописать и перенести все. Как вариант чтобы PHP паук копировал старый и новый урл и записывал куда то в таблицу.
1. Собрать и сделать перенаправление старых на новые из сайтмапа через php (не через htaccess) - решаемо и вполне допустимо. 2. БД, если поля вообще хоть как-то сопоставимы (то есть, содержимое старого может быть помещено - по содержимому - в новые) - переносится ручками. 3. смена адресов в БД может осуществляеться как через скрипт замены, так и вручную.
-> Вручную как-то обрабатывалось/переносилось 27К+ (около 29К) - ничего, за две недели где-то, без напряга. Зато точно, качественно, гарантировано.
Конечно, через парсер+ можно многое сделать - если что-то поддается автоматизации. Для фрилансера нужно суметь четко обрисовать ситуацию и результат - если он поймет до конца, то сможет предложить/предположить возможное решение.
По сути - пепрегоняется содержимое сайтмапа в список - например, таким скриптом Карта сайта из xml в виде гиперссылок через Simplexml и SAX _http://coderhs.com/archive/sitemapxml-to-html - немного подредактировать, чтоб убрать гиперссылки. 2. загоняете в массив - например, через стандартную функцию file - поскольку список будет построчный, то и массив получиться корректный 3. Создаете списокв с новыми адресами, где они построчно соответствуют списку со старыми и загоняете в массив. 4. Помещаете в единую точку входа старого сайта скрипт php, где проверяется условие по запрошенному адресу ($_SERVER['REQUEST_URI']) на соответствие наличию в массиве старого списка, и вывод перенаправления на новый - ключом будет старый (запрошенный адрес), а значением - соответсвующий элемент нового списка, и перенаправление через
PHP код:
<?php header("HTTP/1.1 301 Moved Permanently"); header("Location: http://newaddress.com"); exit(); ?>
Примерно такая логика. Конечно, при практическом подходе может найтись и что более удобоваримое.
Последний раз редактировалось Limon4eg; 20.01.2012 в 01:22.
Coder, Благодарю, на самом деле изящно. Буду реализовывать, вопросы еще задам. А кто что скажет насчет моей идеи создания парсера?
Сообщение от fortunatocat
Поэтому у меня идея - заказать какой то парсер-паук на PHP который пробежится по урлам из сайтмапа и скопирует определенные компоненты страницы на новые адреса + скачает на хост картинку каждой новости и зальет на новый сайт. Вопрос к знатокам, какое примерно ТЗ нужно составить для фрилансера?
За такие деньги на биржах вам действительно рерайт подложат, присоединюсь к последним двум постам !!! Что то дельное, стоит денег !!!
А вы предлагаете за идею 0.5 доллара (потому как больше вы платить не хотите, до 2-х явно написано, так для заманухи школы)... и 10 за ту которую вы реализуете, откуда кто узнает реализовали вы или нет...
Тема ниочем совет мой, проходите мимо господа - Не люблю подобных халявщиков !
Думка,Да что вы ??? Хотите я найду вам с десяток предложении, по продаже простых идей для разного рода бизнеса и стоят они иногда очень больших денег (ОЧЕНЬ больших !)