На самом деле больше всего времени потратил на составление русских badwords (до этого были только английские, которые я убрал) - то есть предлогов и местоимений, который встречаются в тексте очень часто и никак не влияют на результаты поиска, поэтому игнорируются. В результате таблица с поисковыми индексами в базе стала легче почти на 100 метров.
За вычетом этого списка самые часто употребляемые слова на Ложке:
нео - 11199
время - 10912
один - 8546
человек - 7277
люди - 6765
вопрос - 6035
людей - 5996
жизни - 5850
смит - 5531
правда - 5371
матрицы - 5335
день - 5335
сказать - 5262
хочу - 5206
матрице - 5134
делать - 5060
жизнь - 5033
два - 5018
мир - 4910
человека - 4835
стоит - 4779
дело - 4673
лет - 4582
сделать - 4482
сказал - 4174
матрица - 4093
времени - 3955
__________________
Я знаю кун-фу, каратэ, таэквондо и еще много страшных слов!
...Учился фотошопу у Сати...
Мерз-з-зкие покемонс-с-сы...
>> We need focus! <<
Самыми красивыми существами в этой вселенной считаю девушек, кошек и драконов!
ЛОЖКИ. ЛОЖКИ ЭТО ХОРОШО.
Адрес поста | Один пост | Сообщить модератору | IP: Logged