Поиск в Интернете и обратная связь (1 часть)

Автор, философ по образованию и программист по роду работы, пытается как можно доступнее разъяснить смысл предлагаемого им нового алгоритма взаимодействия человека с Сетью и при этом, конечно, несколько увлекается (называя свое изобретение новым этапом эволюции, революцией в философии, обедая клонировать интеллект и т. д.).

Интернет - это тексты
Автор статьи исходит из того, что Интернет -это непрерывно изменяющийся гигантский текст, состоящий из множества частей и дополняющей/украшающей эти тексты графики. Другие гипертекстовые базы данных отличаются от Интернета только размерами. Причем львиную долю информационной нагрузки несут именно тексты в обоих случаях:
1) пользователь взаимодействует с Интернетом и любой базой данных, состоящей из текстов, посредством текстов (например, посредством поисковых фраз);
2) любой используемый документ Интернета или любой текстовой базы данных почти всегда содержит текст (предполагается, что даже одно слово текстообразующе, то есть составляет текст).
Утверждается, что для поиска необходимых частей этого воистину безразмерного текста каждому ищущему информацию необходим некий дружественный интеллектуальный интерфейс.
Иначе говоря, к каждому субъекту поиска необходим индивидуальный подход, при котором рассматриваются все - как явно выраженные, так и скрытые - особенности мышления субъекта. Сумму всех особенностей мышления человека предложено называть мировоззрением. Подобный поход дает основания говорить об индивидуализации Интернета. Индивидуализация Интернета есть представление мировоззрения каждого пользователя в личном интеллектуальном интерфейсе для поиска информации в Интернете.
Само желание появления такого интерфейса представляется понятным - каждый ищет в Интернете только то, что он хочет найти. Однако, что пользователь хочет находить? Не философский ли это вопрос? Будучи программистом и философом и специализируясь в философии языка и новейших технологий, автор пришел к выводу: без фиксации заложенных в основу мировоззрения как созданных, так и найденных и используемых каждым человеком текстов, которые избыточно характеризуют его индивидуальность, невозможно создать вожделенный интеллектуальный интерфейс.

Привычный поиск текстов сегодня
Как выглядит поиск сейчас? Пользователь вручную составляет поисковые фразы и посредством булевой алгебры, через стандарт-
ные интерфейсы (например, через Internet Explorer) находит тексты, содержащие или все, или часть слов из поисковой фразы. Причем нет никакой гарантии, что при этом решаются три основные проблемы, то есть:
1) конструируя поисковую фразу, пользователь выбрал правильные слова;
2) найденные тексты имеют отношение к тематике поиска;
3) полученная информация находится на необходимом пользователю уровне.
Думается, каждый пользователь Интернета знаком с ситуацией: ищешь одно, а находишь... А то и вовсе - порно!
Поэтому наиболее продвинутые поисковые системы (Yahoo!, AltaVista и т. д.), решая первую проблему, недавно начали делать следующее: они дают возможность пользователям строить поисковые фразы, используя то, что сейчас называется ассоциативными связями, хотя Дэвид Юм почти триста лет назад назвал это «привычкой». Например, общаясь, человек привыкает, в частности, использовать те или иные словесные конструкции. То есть ассоциативные связи суть привычки. Вообще, любой процесс обучения есть выработка определенных привычек, не так ли? (Для автора как человека, начавшего изучение нового языка в зрелом возрасте, это очевидно. Недостаточно просто выучить слова! Необходимо понимать оттенки их значений и знать, где, когда и в каких сочетаниях их привычно употреблять.) То, что делают поисковые системы, и есть вычленение привычных связей для наиболее часто употребляемых словесных конструкций путем формирования неких привычных поисковых фраз.
Например, вы ищете компьютер. Тут же вы получаете выбор: персональный, ноутбук, mainframe, софт и т. д. - выбрав mainframe, вы будете иметь возможность решить, например, ищете ли вы работу, связанную с mainframe, хотите ли вы купить mainframe и т. д. Это и есть поэтапное построение привычного ряда слов поисковой фразы.

Привычка и перспективы эволюции поисковых систем
Далее возникает вопрос, а сколько этих привычных поисковых фраз? Не меняются ли они? Да, их число велико, но конечно. Да, они меняются, но относительно медленно. А возможно ли создание ряда наиболее часто употребимых (привычных) словесных конструкций для стандартных поисковых фраз вообще, для всех возможных случаев? Да, возможно! И прогресс поисковых систем упорно движется в этом направлении. Скоро все мы будем иметь возможность найти стандартные поисковые фразы, почти отвечающие запросам каждого из нас. Такой подход почти решил проблему конструирования поисковых фраз для наиболее распространенных случаев поиска. Полное ее решение - это вопрос только времени! Все, что необходимо, - это немножко больше специализации: каждая поисковая система должна знать, с кем она (и кто с ней) работает. То есть проблема эволюции традиционных поисковых систем, «почти» решающая вопрос, - это проблема поиска обратной связи с пользователями и правильного маркетинга.

Что делать?
Но! Слабое место систем нахождения информации, особенно поисковых систем в Интернете, в том, что работают они с документами, составленными как отдельными людьми, так и группами людей, использовавшими и использующими некие привычные только для них словесные конструкции в субъективном смысле именно этих людей. Таким образом, если первая проблема - выбора привычных поисковых фраз - почти решена, то вторая проблема - каким же образом скоррелиро-вать привычные словесные конструкции стандартных поисковых фраз с привычными словесными конструкциями текстов, искомых с их помощью, - нет!¹
Вопрос Вопросов: что делать? Искать смысл текстов? Смысл привычных словесных конструкций текстов? Но одни привыкли понимать одно так, а другие - абсолютно иначе! Формальный смысл текста, вот в чем Вопрос! Сколько споров, столько и обреченных на неудачу попыток найти формальный² (одинаковый для всех) смысл текстов - за последние две с половиной тысячи лет. А что, если... Если попробовать еще раз - нанять, скажем, два-три десятка миллионов профессионалов во всех областях человеческой деятельности и анализировать, анализировать до бесконечности смысл всех непрерывно изменяющихся текстов Интернета? А заодно и решить раз и навсегда, что и кому нужно! Увы, граждане России семьдесят лет принимали участие в этом эксперименте и... Тем не менее, многие исследователи, тратя весьма солидные средства, все еще пытаются повторить это в Интернете.
А может быть, как это делает подавляющее большинство поисковых систем, предоставлять пользователю в первую очередь доступ к текстам документов, владельцы которых проплатили за их право быть представленными в первых строках базы данных этой поисковой системы? Но где гарантия, что привычные словесные конструкции этих документов употреблены в смысле привычных словесных конструкций ищущего? И не нарушает ли подобная практика права потребителя? Нет, не нарушает! Если не нравится (ведь Интернет большой, правда?) -поищите в другом месте! Это и есть плоды стихии начального периода специализации в подборе пользовательской аудитории при полном отсутствии обратной связи...

Лингвистические пределы
Автор утверждает, что проблема распознавания «свой-чужой» на уровне общения решается путем определения сравнительной частоты употребления привычных словесных конструкций. Привычные словесные конструкции играют в данном случае сигнальную роль.
Следовательно, относительная частота употребления привычных словесных конструкций и есть прямое доказательство принадлежности человека к той или иной сфере или сферам человеческого бытия³. Учитывая, что словарный запас каждого человека хотя и велик, но конечен, и что даже профессионалы пера вряд ли знают более 25-30 тысяч слов, а активно используют гораздо меньше, решение лежит на поверхности: нужно просто подсчитать количество привычных словесных конструкции в текстах каждого!

Установление обратной связи в Интернете посредством вычленения мировоззрения авторов текстов
Автором избран путь создания привычных наборов словесных конструкций, характерных для каждой сферы человеческой деятельности и, соответственно, для создаваемых в этих сферах документов. Это путь, приведший к созданию интеллектуального интерфейса, решающего проблему обратной связи в Интернете:
• Интерфейса, позволяющего уникально идентифицировать мировоззрение пользователей Интернета и любой базы данных, состоящей из текстов.
• Интерфейса, основанного на оригинальной методике анализа как созданных, так и использованных текстов, которая разработана на основе работ Пуанкаре, В. Джеймса, Расселла, Виттгенштейна, Райла и многих видных представителей Венского круга.
Эта (уже запатентованная) методика основана, как уже говорилось, на той идее, что каждый текст отражает как сознание, так и мировоззрение вообще его создателя, равно как и групп создателей. Причем «сознание» отражается немедленной мотивацией, например, мотивацией составления поисковой фразы для поиска в Интернете, а «мировоззрение» отражается содержащей долгосрочную, основополагающую мотивацию пользователя - субъективное представление о мироустройстве. Таким образом, поиск информации с использованием профилей, содержащих субъективное представление о мироустройстве, углубляет и расширяет представление обо всех пристрастиях пользователей и помогает из всех найденных текстов отфильтровать те, в основе которых заложено то же мироощущение, что и у ищущих. Обратная связь в данном контексте понимается как возможность установления интерактивной связи в Интернете между объективно близкими мировоззренчески людьми. То есть, в классическом понимании Винера, обратная связь есть обратное воздействие субъекта процесса потребления информации на источник информации.

¹ Действительно, если люди есть преимущественно продукты своего развития, а это развитие и есть обучение вообще, то средство общения и есть продукт привычки! Причем, автор полагает некорректным говорить о языке вообще как средстве общения, а предпочитает говорить о неких привычных словесных конструкциях вообще. Причина этого в том, что, по мнению автора статьи, формального языка, в смысле позитивизма Рассела-Виттгенштейна, не существует! Язык есть некая постоянно изменяющаяся композиция привычных словесных конструкций, сленгов различных групп людей. Формальный же язык полагался позитивистами некой абстрактной и, следовательно, неизменной структурой регистрации фактов в рамках атомарной модели Рассела.

² Формальный и привычный суть различные понятия. Формальное - абсолютная в абстрактности точность в неизменности факта, привычное - постоянно изменяющийся плод реального мира вероятностей, вне фиксации стабильности факта.

³ Предполагается, что сфера человеческого бытия (деятельности) в большинстве случаев определяет достаточно большой процент индивидуальность личности, а наследственность определяет остальное. Также полагается, что бытие есть деятельность, и наоборот.

Окончание статьи - читать.