Дистанционная школа продаж Алексея Катернюка

Библиотека полезных статей

| Главная | Образование | Библиотека |

смайлик 21

Конъюнктурная информация в Интернет: найдется все!

 Екатерина Чернова

Спрос на конъюнктурную информацию на российском информационном рынке чрезвычайно высок. Фирмы, относящиеся серьезно к бизнесу, проводят постоянный мониторинг рыночной ситуации, анализируют тенденции развития своих отраслей, изучают действия конкурентов. Конечно, можно поручить это профессиональным фирмам, однако зачастую это может быть слишком дорого. Жизнь показывает, что такие работы обычно проводятся собственными силами. Как? По-разному. Кто-то под видом клиента уточняет у конкурентов их ценовую политику и планы развития, иные сажают в библиотеку сотрудника с поручением скопировать все материалы по определенной теме. Однако наиболее эффективный, пожалуй, способ – это поиск в Интернет. Вопреки широко распространенному мнению, там все-таки “не все есть”, многие ресурсы – платные. Это отнюдь не исключает возможности и необходимости пользоваться ими, ведь они имеют достаточно удобный сервис, а степень подробности размещенной там информации весьма высока, поэтому иметь с ними дело выгодно. Однако нельзя пренебрегать и бесплатной информацией. Ее все-таки в Интернете 37%. Просто надо правильно искать и правильно ее интерпретировать. Вот про поиск и поговорим подробнее.

Могучий поток информации обрушивается на управленцев разного уровня и рядовых граждан. Объем этого потока трудно поддается учету. Однако подсчитано, к примеру, что ежедневно лишь в сфере технической информации фиксируется 20 миллионов слов. Прилежный работник, способный прочесть за минуту 1000 слов, просиживая за этими текстами 8 часов в день, сумеет переварить этот объем сведений за месяц. Когда он перевернет последнюю страницу, выяснится, что за это время накопилось информации еще на пять с половиной лет каторжного труда. Выход видится только в использовании возможностей вычислительной техники. При этом обязательным элементом систем поддержки принятия решений являются информационные системы.

В качестве субъекта публичного непосредственного доступа к текстовой информации информационных систем мы будем рассматривать неподготовленного потребителя – ведь специалисты-поисковики – большая редкость. Этот пользователь, с одной стороны, не имеет никакого прошлого опыта управления конкретной компьютерной программой (а иногда и элементарных навыков работы со сложной техникой), с другой стороны, посмотрим правде в галза, не в состоянии сформулировать задачу поиска максимально эффективно. И, наконец, он не знает специальной лексики и не имеет никакого представления о том, какими словами решение его проблемы может быть описано в нужном именно ему тексте.

Один из способов самостоятельного поиска необходимой информации при помощи компьютера базируется на ее поиске непосредственно в тексте.

Поскольку потребитель информационной системы всегда идет от своей проблемной ситуации к конкретной программе действий (т.е. пытается понять: “Что делать?” и “Как делать?”), сложности возникают при формулировании цели поиска информации – неясно: “Что, собственно говоря, нужно искать?”

Мышление человека ассоциативно, поэтому постановка задачи поиска информации всегда происходит в субъективных понятиях, каждое из которых может быть выражено средствами естественного языка, множеством лексических образов (слов или словосочетаний). Без специальных методов, о которых речь пойдет далее, составление исчерпывающего перечня лексических образов понятия невозможно.

Проблемы, возникающие при поиске, заключаются в следующем. Анализируемые тексты написаны на литературном языке, который не предполагает многократное употребление рядом одних и тех же слов. При этом каждая мысль автора должна быть неразрывна. В результате пишущий использует все доступные ему языковые средства языка, чтобы одно и то же понятие выразить разными словами, причем с различных точек зрения. К сказанному добавим, что каждый автор имеет разный словарный запас и зачастую использует слова не в их общеупотребительном значении.

Кроме того, одно и то же слово в конкретном естественном языке может иметь длинный ряд словоформ, которые тождественны по смыслу, но совершенно по-разному написаны.

Приведем многообразие только цифрового написания даты “31 декабря 1999 года”: 31.12.99, 31.12.1999, 31/12/99, 31-12-99, 12-31-99 и т.д.

Когда мы преступаем к непосредственно самому поиску, нам предстоит решить ряд важных задач.

Надо определиться, где именно мы будем искать. Достаточно ли информации в открытых источниках на родном языке? В каких внешних источниках ее больше и она актуальнее? Какова глубина ретроспективы требуемых документов?

Далее перед нами не менее сложная задача: выбрать к какому классу инструментов поиска (поисковым машинам общего назначения, поисковым каталогам, новостным поисковым системам и т.д.) обратиться для начала. Если проблема общая, а времени немного, стоит начать с поисковых каталогов, затем провести первоначальный анализ собранной информации, в соответствии с этим переформулировать запрос и направить его уже в общие поисковые или специализированные ресурсы. Если же нужен специфический пласт информации (новости, патенты, официоз, законодательство, вакансии и т.д.), находятся и используются специализированные ресурсы. Также не стоит забывать, что с помощью каталогов поисковых систем можно найти большинство ресурсов Интернет заданного класса с учетом ограничений по языкам приемлемых текстов, видам информации, регионам и странам.

Возможности различных поисковых систем могут существенно отличаться. Именно поэтому всегда полезно изучить справку или документацию к поисковой системе. Там бывает описан минимум возможностей и даны примеры использования поисковой системы. Если же подобного описания нет, то можно использовать один из следующих методов:

Теперь можно приступить непосредственно к формулированию самого текста запроса. Для начала напишите на отдельном листке “проблему, как она дана”. Положите его перед собой и время от времени к нему возвращайтесь для того, чтобы не застревать на нужных и интересных сайтах, которые встретятся на вашем пути к информации.

Обязательно надо проверять написание слов, в которых вы не совсем уверены. Обидно будет потерять весьма ценный документ из-за подобной оплошности. Причем для того, чтобы это сделать, вовсе не обязательно разыскивать том орфографического словаря. Вместо этого, можно воспользоваться статистикой найденных документов. Легко догадаться, что если количество найденных документов на запрос “моркетинг” составило три с половиной документа, то, скорее всего, это вы что-то перепутали, а не поисковая система вам выдала несколько засекреченных текстов. Кстати, нужно учесть, что некоторые слова могут иметь близкие написания, причем ни одно из них не будет ошибочным, например, “изморось” и “изморозь”.

Проведите исследование значения терминов и анализ смысла формулировок. Если используемое вами слово многозначно, либо уточняйте нужный смысл с помощью добавления контекста, либо “отрезайте” неподходящие контексты, используя оператор “И НЕ” (тильда “~” и двойная тильда “~”).

Расширяйте элементы запроса синонимами (налог– акциз – подать – сбор), при необходимости антонимами (разрешено – запрещено) и соподчиненными (видовыми) понятиями (недвижимость – здание, самолет, морское судно, космический аппарат и т.д.). Обращайте внимание на то, что некоторые слова гораздо чаще могут встречаться в виде аббревиатур (Россия – РФ). Контролируйте наличие подходящих по смыслу сокращений (статья – ст.), однокоренных слов (производство – производить – производитель), иных написаний (пять – 5) и обязательно расширяйте ими запрос. Ведь неизвестно, как мог автор выразить то, что вы ищите.

Примените декомпозицию решаемой проблемы – выделите наиболее существенные смысловые элементы (понятия) проблемной ситуации:

Формируйте запрос, последовательно добавляя наиболее существенные элементы описания проблемной ситуации.

Увидев подходящий фрагмент текста, просмотрите страницу вперед и назад. Это часто дает интересную информацию, а иногда – и решение проблемы. Кроме того, так же можно найти описание подходящей ситуации, которое может дать новое направление вашему поиску.

Увидев подходящий фрагмент текста, запишите его. Теперь вы точно знаете, что вам нужно. Прекращайте дальнейший просмотр результатов поиска и начинайте новый поиск с уточненной формулировкой.

Если в результате поиска ничего не найдено, либо найдено немного совершенно неподходящих текстов – не отчаивайтесь. Либо уменьшайте конкретизацию описания проблемы (последовательное удаление наименее существенных элементов поискового запроса), либо проведите логическое обобщение одного из элементов описания решаемой проблемы (Юхнов > Калужская область > Россия).

Если же полученная выборка слишком велика и поставленная проблема не решена, то вы можете выбрать в запросе наиболее часто встречаемое слово и постараться операторами исключения (тильда и двойная тильда) отсечь все контексты, в которых это слово имеет неподходящий смысл, либо добавить в запрос уточняющий термин. Наберитесь терпения и успеха вам не избежать!

Итак, немного разобравшись с принципами уточнения смысла специальных терминов и получив представление о стратегиях поиска в Интернет, начнем выполнение поставленной задачи с изучения национальной поисковой системы Интернет Яндекс http://www.yandex.ru.

В этой системе существуют несколько режимов поиска.

Естественно-язычный поиск http://www.yandex.ru ориентирован на обработку запросов на естественном языке и не использует операторов, что позволяет без лишней головной боли найти информацию по произвольно сформулированной проблеме, просто записав ее в поле запроса.

Расширенный поиск http://www.yandex.ru/advanced.html имеет все возможности естественно-язычного и строго режимов поиска (поле “Запрос”) с возможными ограничениями по территории (выпадающее меню “Поиск в регионах”) и поиском различных объектов (тексты, картинки, иные) с помощью меню:

Каталог ресурсов Интернет создан редакторами Яндекс и ориентирован на выбор ресурсов из иерархического меню (Бизнес и экономика, Производство и поставки, Общество и политика, Наука и образование, Компьютеры и связь, Дом и семья и т.д.)

Рубрика Регионы (Москва, Санкт-Петербург, Екатеринбург, Красноярск и т.д.) позволяет целенаправленно искать сервера, расположенные на какой-либо конкретной территории или сгруппированные по определенным темам (примерно такую же структуру имеют и другие популярные поисковые роботы, например, www.rambler.ru).

Аскетичный поиск http://ya.ru или http://www.ya.ru имеет гибкий командный язык запросов (с множеством операторов) и богатые возможности, но эффективное его использование требует специального изучения и практики. Если вы имеете доступ в Интернет по коммутируемой линии и не нуждаетесь в дополнительных сервисах, описанных выше, лучше пользоваться этой легкой поисковой формой, ведь головная страница http://www.yandex.ru весит более 50 Кб и при плохой связи может вообще не загрузиться.

Кроме запросов на естественном языке пользователям Яндекс предлагается строгий поиск при помощи языка запросов, который состоит из операндов. В поисковом языке Яндекс операнд – это конкретное понятие, задающее поисковой машине соответствие единиц запроса и единиц текста. Границами слова (как отдельного операнда) являются пробелы и разрешенные знаки – разделители фразы.

Для того, чтобы найти словосочетание, как оно дано, можно использовать кавычки, например, “подоходный налог”. Яндекс прочтет такое условие следующим образом: эти слова должна стоять в тексте рядом, через пробел.

Восклицательный знак “!” используется Яндексом в качестве оператора модификации слова. Дело в том, что Яндекс учитывает морфологию русского языка, т.е. если в запрос ввести “шел”, то он будет искать все формы глагола “идти”. Восклицательный знак позволяет найти не все формы, а только ту, которая нужна именно вам.

Ампресанд “&” выполняет функцию оператора одновременного присутствия слов в одном предложении, например, “знак&амперсанд”.

Плюс “+” – оператор обязательного присутствия следующего за ним слова в одном документе.

Вертикальная черта “|” зарегистрирована в качестве оператора альтернативности (обязательное присутствие в одном тексте любого из слов), например, “Россия|российский”.

Верхняя волнистая черта “~” интерпретируется как оператор исключения второго слова из предложения, например, “консульского~округа”. В таком случае поисковая система должна найти только документы, содержащие слово “консульский” и не содержащие слова “округ” в одном предложении.

Использование в запросе некоторых знаков внутри слова сразу приводит к сообщению о синтаксической ошибке. К запрещенным знакам в Яндаксе относятся:

§         Доллар “$”

§         Решетка “#”

§         Звездочка “*”

§         Кавычки непарные “””

§         Квадратные скобки “[ ]”

§         Больше, меньше “<”, “>”

§         Равенство “=”

§         Двоеточие “:”

С запрещенными символами можно справиться следующими способами: либо поставить оператор “фраза” (заключить в кавычки), либо заменить этот символ на разрешенный.

И еще практический совет: некоторые запросы получаются достаточно объемными, поэтому для того, чтобы не запутаться со скобками, которые объединяют слова (российский|РФ|Россия|русский), следует их сразу ставить парными и затем печатать внутри. Также надо учитывать, что в языке запросов Яндекса существуют т.н. “стоп-слова” (“не”, “же” и т.д.). Так, например, если ввести в запрос фразу “не пойман – не вор”, можно получить совершенно противоположный результат. Попробуйте!

При подготовке статьи использованы материалы семинара Сергея Кузнецова “Конкурентная разведка при помощи интернета”.

 


 

© ООО "НПО BraVo Consultant Ltd." 2005 - 2008

По всем имеющимся у вас вопросам напишите:

E-mail: akmedia2@mail.ru