интересная тема и для меня. давайте обсудим. как я вижу такую реализацию. бот бегает по сайту и грабит весь контент. потом разбивает все на пассажи и складывает все в базу. потом по какойто формуле найденой практическим путем определяет наиболее релевентные пассажи и потом все линкуется. идея думаю понятна, жду критики
Без разницы, весь ваш сайт(блог) сам по себе одной тематики, поэтому можете линковать хоть как, лишь бы это было равномерно для ботов и полезно для людей...
Если миллиард статей, то почему бы не сделать метки к этим статьям? Метки забиваются в ручную при добавлении новости, или автоматом исходя из ключей (лучше конечно вручную). И по меткам уже видно что у них общее.
Это смотря что добавляется в метки. Если как здесь висит "потом, стать...", то конечно не катит. А если по названиям новостей брать сравнение? В них же, как правило, основной смысл закладывается.