August 25th, 2014

2009

Технические мечты

На самом деле, неплохо бы написать программку, которая обходила бы топ 10 тысяч (сто, миллион) мест, где публикуются новости, и делала три с половиной простых вещи:

1. Дедупликация. Если одна и та же новость с несущественными изменениями повторена 100 раз, зачем видеть её 100 раз? Достаточно одного. "Одна и та же" может плавно настраиваться от "слово в слово" до "частично совпадают лишь матюги" по желанию пользователя.

Collapse )

Пусть оно будет написано как попало. Пусть далеко от идеала. Но пора уже. И я в данном вопросе не собираюсь принимать ничью сторону. Просто градус вранья и в мирное-то время не радовал, а сейчас вообще угрожает выживанию человечества, неужели не видно? Задохнёмся же, к %%ням, в собственном %$^е и @##$е....

P.S. Википедия и Google news в некотором приближении эту задачу как раз и пытаются решать. Но вот не доводят до того, что хотелось бы видеть.