Banned - Репутация: 80
- Webmoney BL: ?
| Сообщение от rushter PHP код: <?php
if (!isset($_GET['surl']))
echo <<< HERE
<form>
Введите url:<br>
<input type="text" name="surl"><br>
<input type="submit" value"начать"
</form>
HERE;
else {
$log = fopen("keywords.txt", "at");
$smap = file_get_contents($_GET['surl']);
preg_match_all('#<a href="[^а-я].*">(.*)</a>#iU', $smap, $arrmap);
foreach ($arrmap[1] as $arr) {
fwrite($log, preg_replace("#(<.*>(.*)</.*>|<.*>(.*)[а-яА-Я].*)#iU", "", $arr) . "\n");
}
}
?>
Ну и вдобавок ко всему скрипт для парсинга кеев с ваших sitemap :). Работать будет глючно на некоторых дизах из за не валидной регулярки вытаскивания ссылок. Вечно натыкаюсь на это проблему при парсинге html. У атрибутов могут быть как двойные, так и одинарные кавычки. Так и не быть вообще
|