• Методы сбора информации в сети интернет. Источники информации, методы поиска и сбора данных в сети интернет. Пример. Базы данных

    2. Регистрация базы данных

    Перед выполнением с помощью приложения IBExpert любых операций с существующей базой данных она должна быть зарегистрирована. Для этого либо используется команда меню "База данных> Зарегистрировать базу", либо в окне создания базы данных выбирается опция "Зарегистрировать после создания".

    В результате открывается диалоговое окно "Параметры базы данных" (Рис. 4), в котором надо заполнить практически такие же поля, что и при создании базы данных, затем нажать кнопку .

    Для проверки правильности параметров, введенных в окне регистрации базы данных, следует нажать кнопку [Проверка коннекта]. Это приведет к открытию диалогового окна "CommunicationDiagnostics", в котором в поле "TestResults" будут содержаться результаты подключения. Там же будут находиться сведения о версии используемой СУБД.

    После регистрации вся введенная о базе данных информация запоминается приложением IBExpert и в окно "DatabaseExplorer", в дерево на вкладке "Базы" добавляется узел с зарегистрированной базой данных (Рис. 5)*.

    Чтобы подключиться к зарегистрированной базе данных, надо выбрать нужную базу данных в списке (Рис. 5) и выполнить команду "База данных > Подключиться к базе", либо сделать двойной щелчок мышкой на выбранной базе данных.

    Если все параметры подключения были введены правильно, то произойдет подключение к базе данных, название подключенной базы данных в окне "DatabaseExplorer" будет выделено жирным шрифтом, а также появятся вложенные узлы с объектами, содержащимися в подключенной базе данных

    После подключения к базе данных можно просматривать имеющиеся объекты, создавать новые, вносить и просматривать данные, а также проводить операции с имеющимися объектами.

    Порядок действий: Устанавливаем на компьютер VisualStudio. Стоит устанавливать расширенный комплект, так как в стандартный sql не входит. Открываем VisualStudio, выбираем вкладку «Tools» → «ConnecttoDatabase». В появившемся окне выбираем тип БД «MicrosoftSqlServerDatabasefile» → «Continue». В появившемся окне выбираем место хранения БД на компьютере. Нажимаем "Ок". После этого в правой части экрана в списке файлов появится файл созданной БД. Дважды кликаем по файлу БД. В открывшемся списке правой кнопкой мыши нажимаем на «Tables» → «New». Появляется пустое поле таблицы. Заполняем таблицу. Таблицы заполняются в соответствии с ранее созданной моделью. Фактически переносим модель в sql. Для создания новой таблицы повторяем пункт 5. Одно из полей таблицы нужно установить ключевым. Для этого выбираем необходимое поле (чаще всего ключевым бывают поля, содержащие id) и нажимаем на знак ключа на панели инструментов. В каждой строке необходимо выбрать тип данных. Тип данных определяет, в каком виде объект может хранить информацию в данном поле. После установления определенного типа данных ввод данных другого типа будет невозможен. Если наша строка содержит текстовое значение, то это могут быть типы CHAR(M), VARCHAR(M), TINYBLOB, TINYTEXT, BLOB, TEXT, MEDIUMBLOB, MEDIUMTEXT, LONGBLOB, LONGTEXT - в зависимости от предполагаемого объема памяти, который будет хранить строка. Еслитипданных - число, топодойдут BOOLEAN, INTEGER, DECIMAL, FLOAT, REAL, DOUBLE, PRECISION. Если хранить строка будет данные о времени и дате, то используем DATE, TIME, TIMESTAMP, DATETIME. Бинарные данные могут иметь типы "Бинарные", "image", "varbinary". Прочие типы данных: "cursor", "hierarchyid", "sql_variant", "table", "timestamp", "uniqueidentifier", "xml", "Пространственные типы".



    14.Использование Интернета для сбора источников. Сотрудничество в научной сфере.

    Современные подходы к использованию компьютерных сетей предполагают реализацию информационного взаимодействия участников образовательного процесса в различных режимах работы Всемирной информационной среды. Интернет-технология обеспечивает современных пользователей всеми ресурсами глобальных телекоммуникаций, позволяет организовать учебную деятельность с использованием прикладных и инструментальных программных средств и систем, доступных современному пользователю. В этой связи перспективным направлением является разработка научно-педагогических основ создания и использования Глобальной информационной среды непрерывного образования на основе создания Единого образовательного пространства, (информационно-предметной среды) регионального/глобального масштаба.

    При всем многообразии информационных и телекоммуникационных технологий, а также способов организации данных при их пересылке по каналам связи всемирная информационная компьютерная сеть Интернет занимает центральное место. Более того, на сегодняшний день, это практически единственная глобальная телекоммуникационная сеть, повсеместно используемая в системе общего среднего образования. Этому во многом способствуют высокая скорость и надежность передачи через Интернет данных различных форматов (текст, графические изображения, звук, видео и пр.).Сеть Интернет предоставляет возможность коллективного доступа к учебным материалам, которые могут быть представлены как в виде простейших учебников(электронных текстов), так и в виде сложных интерактивных систем, компьютерных моделей, виртуальных учебных сред и т.д. Количество пользователей и источников информации сети Интернет непрерывно увеличивается. Кроме того, происходит постоянное улучшение качества предоставляемых телекоммуникационных услуг.



    Информатизация является одним из основных факторов, заставляющим образование совершенствоваться. Изменяются содержание и методы обучения, меняется роль педагога, который постепенно из простого транслятора знаний превращается в организатора деятельности обучаемых по приобретению новых знаний, умений и навыков. Существенным средством информатизации являются образовательные информационные ресурсы, опубликованные в сети Интернет, которые позволяют:

    · использование информации, размещенной на учебных и научных сайтах сети Интернет (Web-сайтах),для подготовки учебно-методических материалов. Рефератов и сообщений;

    · организацию представительства учебного заведения в сети Интернет;

    · создание сайта, посвященного содержанию школьной дисциплины и размещение его в сети Интернет;

    · размещение личных Web-сайтов учителей и школьников.

    Путь к огромному информационному багажу человечества, хранящемуся в библиотеках, фонотеках, фильмотеках, лежит через карточки каталогов. В Интернете существуют аналогичные механизмы для нахождения требуемой информации. Речь идет о поисковых серверах, служащих отправной точкой для пользователей. С содержательной точки зрения о них можно говорить как о еще одной специальной службе сети Интернет.

    В сети Интернет существует достаточно много каталогов и порталов, собирающих информацию, которая может быть использована педагогами. Использование таких каталогов и информационных ресурсов сети Интернет целесообразно для:

    · оперативного обеспечения педагогов, обучаемых и родителей актуальной, своевременной и достоверной информацией, соответствующей целям и содержанию образования;

    · организации разных форм деятельности обучаемых, связанных с самостоятельным овладением знаниями;

    · применения современных информационных и телекоммуникационных технологий (технологий мультимедиа, виртуальной реальности, гипертекстовых и гипермедиа-технологий) в учебной деятельности;

    · объективного измерения, оценки и прогноза результативности обучения, сопоставления результатов учебной деятельности школьников с требованиями государственного образовательного стандарта;

    · управления учебной деятельностью учащегося, адекватно его уровню знаний, умений и навыков, а также особенностям его мотивации к учению;

    · создания условий для индивидуального самостоятельного обучения школьников;

    · постоянного и оперативного общения педагогов, обучаемых и родителей, нацеленного на повышение эффективности обучения;

    · организации эффективной деятельности учреждений общего образования в соответствии с принятыми в стране нормативными положениями и содержательными концепциями.

    Целесообразными к использованию в общем среднем образовании могут оказаться самые разные информационные ресурсы сети Интернет. Среди таких ресурсов можно выделить образовательные Интернет-порталы, которые сами являются каталогами ресурсов, сервисные и инструментальные компьютерные программные средства, электронные представления бумажных изданий, электронные учебные средства и средства измерения результатов обучения, ресурсы, содержащие новости, объявления и средства для общения участников образовательного процесса.

    Используя информационные ресурсы сети Интернет, педагоги смогут более эффективно управлять познавательной деятельностью дошкольников, оперативно отслеживать результаты обучения и воспитания, принимать обоснованные и целесообразные меры по повышению уровня обученности и качества знаний учащихся, целенаправленно совершенствовать педагогическое мастерство, иметь оперативный адресный доступ к требуемой информации учебного, методического и организационного характера. Педагоги, занимающиеся разработкой собственных информационных ресурсов, приобретают дополнительную возможность использования фрагментов образовательных ресурсов, опубликованных в сети, делая необходимые

    Большинство наиболее качественных информационных ресурсов, использование которых повысило бы эффективность общего среднего образования каталогизировано на образовательных Интернет-порталах. В настоящее время в России уже выработана организационная схема создания системы образовательных порталов, имеющая свои особенности. В организационную схему создания системы образовательных порталов включаются:

    · горизонтальный портал «Российское образование» (www.edu.ru),

    · профильные вертикальные порталы по областям знаний: гуманитарный, экономико-социальный, естественно-научный, инженерный, педагогический, медицинский, сельскохозяйственный и др.,

    · специализированные вертикальные порталы: книгоиздание, единый экзамен, новости образования и др.

    Горизонтальный портал «Российское образование» обеспечивает:

    · навигацию по всем вертикальным порталам;

    · поиск мультимедиа-информации в области образования в Интернет;

    · персонификацию и персональную адаптацию интерфейса как путем выбора пользователем собственной категории (обучаемый, преподаватель, администратор, разработчик портала) и указанием уровня образования, так и путем конструирования собственного интерфейса;

    · формирование и предоставление срезов вертикальных порталов по уровням образования;

    · хранение и предоставление информации в области образования (законодательство, приказы, нормативные документы, стандарты, перечни специальностей, федеральный комплект учебников, база данных вузов и др.);

    · публикацию ежедневного обзора прессы по вопросам образования;

    · новостную ленту в области образования;

    · организацию проведения форумов, дискуссионных групп, списков рассылки.

    С мире науки, Демоскоп, Скопус

    ВВЕДЕНИЕ

    Сеть Интернет похожа на огромную мировую библиотеку, имеющую только одно, но существенное отличие: для поиска книги в библиотеке есть каталог, в крайнем случае, можно обратиться к опытному библиотекарю. Полного каталога Интернета не существует. Но, тем не менее, поиск в глобальной компьютерной сети возможен, и это, пожалуй, является одной из наиболее важных его сторон. Для поиска данных в сети используются специальные серверы, информация на которых поддерживается и обновляется практически автоматически.

    Сегодня, когда Интернет стал одним из основных источников информации, поиск в Сети приобретает все большую практическую ценность. Но с быстрым увеличением объема доступных данных все более усложняется и сама процедура поиска.

    Интернет – это глобальная компьютерная сеть, которая связывает между собой как пользователей компьютерных сетей, так и пользователей ПК. Интернет медленно, но верно становится основным средством корпоративного общения, уступая пока телефону.

    В Сети наличествует гигантское количество информационных ресурсов. По некоторым оценкам, число документов превысило 65 млн. и продолжает стремительно расти. Такой объем информации требует правильной организации процесса поиска и применения специальных технических средств, таких как поисковые машины. Простой поиск по достаточно распространенному ключевому слову дает обычно от десятков тысяч до нескольких миллионов ссылок. Очевидно, что работа с таким большим количеством документов практически невозможна, тем более что подавляющая их часть содержит информацию, не относящуюся к делу.

    Источники информации в Интернете различаются по способу представления информации, а следовательно, и по методу доступа к ним.

    1 СРЕДСТВА ПОИСКА

    1.1 Средства поиска файлов

    Поиск файла вручную в сложной структуре каталогов ftp-сервера может занять достаточно много времени. Для упрощения и ускорения поиска была разработана поисковая служба Интернета Archie, представляющая собой специальные Archie-сервера, хранящие содержание каталогов анонимных ftp-серверов. При обращении с поисковым запросом на Archie-сервер результатом поиска является список адресов анонимных ftp-серверов, на которых имеется искомый файл.

    Но возникает задача отыскать среди множества файлов этого сервера искомый, что достаточно сложно из-за маловыразительных и непонятных имен файлов и каталогов. Для решения этой проблемы используется система Gopher, позволяющая перемещаться по системе контекстных меню, показывающих содержимое фай лов с использованием понятых обозначений. Существует очень много Gopher-серверов, которые содержат архивы данных в виде иерархически структурированных каталогов, упорядоченных по содержанию. Работа с ними очень проста и соответствует работе с обычным отображением файловой системы.

    Существует расширение этой системы - Veronica, которое содержит в своей базе данных каталоги всех Gopher-серверов. После ввода поискового запроса Veronicaавтоматически просматривает все Gopher-каталоги на наличие искомой информации и тем самым избавляет от долгого поиска вручную по многим Gopher-серверам.

    С таким способом навигации Gopherв определенной степени был предшественником WWW. В настоящее время применение Gopherуменьшается пропорционально росту использования WWW.

    1.2 Средства WWW - WorldWideWeb (Всемирная сеть)

    В 1993 году была разработана информационно-поисковая система WWW, которая благодаря простоте навигации и доступности открыла информационные источники Интернета неподготовленным пользователям. WWW вызвал бум в сети Интернет, который продолжается по настоящее время, и объемы доступной информации Интернета ежегодно удваиваются.

    WWW основывается на принципе гипертекста (уже знакомого читателю), то есть на системе документов, связанных гиперссылками. Гипертекст представляет собой ключевые Слова, особым образом выделенные из обычного текста. Гипертекстовые ссылки отправляют пользователя на другие документы того же сервера либо на другие сервера, которые могут располагаться в любом месте Интернета. Если этот текстовый документ тоже гипертекстовый, то его ссылки позволяют перейти далее на соответствующие документы. Каждая переадресация происходит для пользователя незаметно, так что он может просматривать информационный состав Интернета но содержательному принципу, не заботясь об адресации конкретных компьютеров.

    С развитием мультимедийных приложений изначально чисто гипертекстовые документы все больше и больше становятся гипермедийными. Таким образом, WWW-документы могут существовать в любом формате данных: текст, графика, звук/музыка или видеоклип. Ориентация и навигация во Всемирной сети происходят с использованием специальных программ, называемых WWW-браузерами, обеспечивающими пользовательский интерфейс, как, например, NetscapeNavigator или MicrosoftInternetExplorer.

    Отправной точкой поиска информации служит, как правило, основная (базовая, домашняя) страница (сайт) информационного ресурса, которой можно достичь, введя соответствующий адрес в браузере (например, http://ncpi.gov.byили www.iparegistr.com). WWW-сайты создаются и обновляются фирмами либо специальными организациями, публикующими информацию и следящими за содержанием своих WWW-страниц. Использование WWW, таким образом, не является пассивным, и каждый пользователь Интернета при помощи специальных программ-редакторов гипертекста может самостоятельно создавать собственные интерактивные WWW-страницы. Это и открыло путь для растущей коммерциализации и расширения Интернета.

    В настоящее время вновь создаваемая информация, как правило, изготавливается с учетом необходимости обеспечения WWW-доступа, а более ранние документы постепенно преобразуются под него, однако во всем мире существуют еще миллионы файлов в форм отличных от требований WWW. Для использования этой информации и через WWW в браузеры включены вышеописанные службы Интернета, обеспечивающие доступ к ней (telnet, ftp, Archie, Gopher). Через WWW можно использовать и другие службы Интернета, которые предназначены для общения (eMail, NetNews). Поэтому WWW-браузер стал в настоящее время универсальной коммуникационной программой Интернета.

    С появлением WWW-службы и начался бум в сети Интернет. Благодаря этой простой в применении и единой для всех служб пользовательской среде Интернет заинтересовал множество людей и организаций. Оказалось вдруг, что не надо быть специалистом в области Интернета, чтобы пользоваться службами сети. Это можно сравнить с успехом фирмы Microsoft, связанным с выпуском MicrosoftWindows в качестве графической пользовательской оболочки. До появления Windows у каждого DOS-приложения было собственное руководство пользователя и тем самым требовалось отдельно изучать каждое приложение.

    2 ОСНОВНЫЕ ПРИЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ

    2.1 Основные требования к поиску

    К результатам поиска предъявляются требования полноты охвата ресурсов, достоверности полученной информации, минимальных затрат времени и максимальная скорость поиска.

    Требование полноты охвата ресурсов не нуждается в дополнительных пояснениях, за исключением необходимости использовать при поиске ресурсы не только WWW, но и других служб Интернета.

    Достоверность информации, учитывая природу Интернета, становится чрезвычайно важным требованием. Оценка достоверности может производиться как традиционными методами (проверка легальности публикаций на бумажных носителях, получение сведений об организациях и авторах, выяснение действительности их электронных ресурсов и т.п.), так и с Использованием возможностей Интернета (ознакомление с альтернативными источниками информации, сверка фактического материала, установление частоты его использования другими источниками; выяснение статуса документа и рейтинга источника средствами поисковых систем, получение информации о компетентности и статусе автора материала с помощью специальных поисковых сервисов Интернета; анализ отдельных элементов организации сайта с целью оценки квалификации поддерживающих его специалистов и другое).

    Время поиска, не считая затрат времени, связанных с техническими характеристиками подключения, в основном зависит от планирования поиска и навыков работы специалиста по поиску с ресурсом выбранного типа. Планирование поиска заключается в определении требуемых для разрешения поискового требования поисковых служб и порядка их применения. Кроме того, многое зависит от навыков и опыта конкретного специалиста по поиску.

    Как уже отмечалось, информация в Интернете доступна из источников разного типа. Прежде всего - это WWW-ресурсы (гипертекстовая система, каталоги ресурсов, поисковые машины). Кроме того, это уже известные читателю электронная почта, почтовые роботы, Usenet и другие телеконференции, а также ftp-системы и архивы (с применением Gopher и Veronica). WWW позволяет производить поиск требуемых ресурсов на основе своих гиперсвойств, то есть имеющиеся поисковые системы работают с использованием гиперссылок в автоматическом режиме, не исключая возможности ручного просмотра. В WWW имеется целый ряд поисковых сервисов как общего, так и специализированного назначения.

    Когда нам необходимо найти нужную нам информацию в Интернете, у нас есть несколько способов достичь желаемого. Большинство людей используют поисковики, вбивая необходимый запрос и изучая предоставленную поисковую выдачу. Для определенных целей нельзя обойтись без использования специализированных баз данных (БД) или же сайтов-каталогов.

    То, как вы ищите необходимую информацию, зависит только от вашего желания и определяет, как много информации вам придется переработать перед тем как найти то, что вы ищите, и сколько времени на этом понадобится.

    Рассмотрим кратко несколько способов поиска:

    1. Если вы решили воспользоваться поисковиком для получения общей информации о чем-либо, то выдача из миллионов страниц и многочисленные переходы по ссылкам не должны вас испугать. Но если ваша цель – это поиск конкретной информации, то могут возникнуть проблемы. Этот способ не гарантирует достоверность информации и требует много времени.

    С другой стороны, большинство поисковиков, например, таких как Яндекс и Google, позволяют сузить границы поиска. Во-первых, можно воспользоваться фильтрами расширенного поиска. С помощью данных фильтров можно выбрать нужный вам регион, ограничить результаты поиска по дате обновления документов, определить язык документа и многое другое. Во-вторых, в том же Яндексе, имеется «язык запросов». Его суть в том, что для ограничения области поиска можно использовать специальные операторы, которые позволяют:

    Получить в выдаче только документы, содержащие запрашиваемое слово в заданной форме

    Уточнить наличие и взаимное расположение запрашиваемых слов в документе

    Ограничить поиск по типу файла, хосту и т. д.

    2. Если вам необходимо найти информацию по определенной теме, то подойдет поиск по каталогам. На подобных сайтах информация систематизирована и структурирована, разбита по темам и подтемам, что упрощает поиск нужного именно вам раздела. Такие сайты редактируются живыми людьми, поэтому чаще всего предоставленным там ссылкам можно доверять. Конечно, такой способ поиска, если вам нужно найти конкретный документ, не особо эффективен, но он хорошо подходит в случаях, когда вам надо найти как можно больше информации по широкой теме.

    В Интернете имеется огромное количество каталогов, как специализированных, посвященных одной широкой теме, так и многопрофильных.

    В качестве примера можно рассмотреть два крупных, многопрофильных каталога. DMOZ – это один из крупнейших каталог ресурсов Интернета. Если рассматривать сугубо русскоязычные каталоги, то можно выделить list.mail.ru. Далее мы расскажем чуть больше о данных ресурсах.

    3. Поиск по базам данных эффективен при тематическом поиске. Сбор нужной нам информации в зарубежных и русскоязычных информационных, образовательных и научных ресурсах очень часто требует больших усилий и может стоить значительных затрат средств и времени.

    В Сети существует огромное количество баз данных - фактографических, библиографических, полнотекстовых, объектографических и т.д., которые, в зависимости от содержания хранящейся в них информации, можно подразделить на универсальные, отраслевые и тематические. Например, библиографические базы данных по своей сути являются электронными аналогами традиционных печатных библиографических изданий. Библиографические базы данных, как правило, поддерживают единожды заданный, четкий алгоритм описания документов по определенным критериям. Это способствует нахождению необходимой информации, особенно, если ставится задача найти какую-либо конкретную публикацию, вышедшую в периодическом издании.


    Пример. Каталоги.

    Каталог сайтов Интернета, или каталог Интернет-ресурсов, или просто Интернет-каталог (англ. webdirectory) - структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам.

    1. OpenDirectoryProject (ODP, Открытый Каталог (ODP)), также известный как DMOZ (от одного из своих первых доменных имён directory.mozilla.org) - многоязычный свободный каталог ссылок на сайты всемирной паутины, поддерживаемый интернет-сообществом добровольных редакторов.

    На данный момент на сайте можно найти:

    3,884,779 сайтов

    Информация доступна на 90 языках, в том числе нарусском, немецком, английском, греческом, французском, японском, корейском, итальянском и так далее.

    На сайте работают 91,790 редакторов.

    Основные категории: искусство, бизнес, компьютеры, игры, здоровье, дом, новости, отдых, справочники, регионы, наука, покупки, общество, спорт, каталог для детей и подростков. Каждая из этих основных категорий подразделяется на огромное количество подтем.

    DMOZ-ом управляет AOL Inc. (американский медийный конгломерат, поставщик онлайн-служб и электронных досок объявлений). Управлением занимается небольшая команда специалистов, ответственных за редакционную политику и руководство, управление сообществом и его развитие, а также за системное проектирование.

    Однако, в первую очередь, DMOZ - это саморегулирующиеся сообщество. С помощью системы самоуправления, редакторы-добровольцы управляют ростом каталога и его развитием, а система сдержек и противовесов обеспечивает высокое качество контента.

    DMOZ является открытым источником, основанном на волонтерской инициативе. AOL Inc. Управляет им в большей степени как некоммерческой организацией и стремится сохранить его атмосферу открытого и свободного ресурса.

    2. Если говорить о русскоязычных каталогах, то можно выделить Каталог@mail.ru. По аналогии с DMOZ, здесь есть основные темы, которые потом разбиваются на более мелкие. Всего 18 основных категорий: автомобили, интернет, медицина и здоровье, новости и СМИ, производство, бизнес и финансы, компьютеры, наука и образование, спорт и так далее.

    Для удобства пользователей внутри каждого раздела можно видеть разбивку всех имеющихся по этой теме ссылок по:

    Типам сайтов (информационные, корпоративные, персональные, сайты-сервисы, частные, информационно-сервисные)

    Так же можно сортировать выдачу по алфавиту, дате и популярности.

    Каждый день Каталог@mail.ru предоставляет топ самых посещаемых сайтов за день из тех, что имеются в каталоге.


    Пример. Базы данных.

    Espacenet (ранее часто упоминался как esp@cenet) это бесплатный онлайн сервис для поиска патентов и патентных заявок. Espacenet разработан Европейским патентным ведомством (ЕПВ) совместно с государствами-членами Европейской патентной организации. Большинство государств-членов имеют возможность пользоваться Espacenet на своем государственном языке и имеют доступ к Всемирной базе данных ЕПВ, большинство из которых на английском языке. В 2015 году Espacenet утверждали, что у них зарегистрированы записи о более чем 90 миллионов патентных публикациях.

    Проект Espacenet был запущен впервые в 1998 году, совершив революцию в сфере международной патентной информации, сделав её общедоступной и тем самым навсегда изменив порядок распространения, проверки и поисков патентов.

    В 2012 ЕПВ запустило проект «PatentTranslate», бесплатный онлайн-сервис автоматического перевода патентов. Этот сервис был созданный в партнерстве с Google и был "специально построен так, чтобы обрабатывать сложную патентную лексику". «PatentTranslate» охватывает 31 язык.

    С марта 2016 года, Espacenet начали предлагать полнотекстовый поиск по базе английских, французских и немецких патентных документов.

    Пример. Поисковик.

    Поисковая система - это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем - веб-сервисы для поиска текстовой или графической информации во Всемирной паутине.

    Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами.

    В архитектуру поисковой системы обычно входят:

    Поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,

    Индексатор, обеспечивающий быстрый поиск по накопленной информации, и

    Поисковик - графический интерфейс для работы пользователя.

    На данный момент у пользователей есть широкий выбор, каким именно поисковиком они хотят воспользоваться для нахождения необходимой им информации: Google, Bing, Yahoo!, Яндекс, Рамблер и так далее.

    В качестве примера мы рассмотрим поисковую систему Bing. Bing является относительно молодым поисковым сервисом, впервые заявившим о своем существовании лишь в 2009 году, и был представлен генеральным директором Microsoft Стивом Балмером. Однако, несмотря на свою молодость, данная поисковая система уже сегодня в некоторых европейских странах, а также странах Северной Америки уступает по своей популярности лишь поисковому гиганту компании Google.

    Bing наиболее популярен в таких странах как: США, Китай, Германия, Индия и Великобритания.

    Поисковик обладает лаконичным внешним видом, а для нахождения информации можно использовать также категории «Изображения», «Видео», «Карты», «Новости». Кроме того, Bing имеет своего переводчиком на базе MicrosoftTranslator. К особенностям данного поисковика можно отнести то, что прямо в поисковике, без установки на компьютер, можно пользоваться лицензионным продуктами MicrosoftOffice.

    Если оценивать данный сайт как источник информации, то можно столкнуться с одной особенностью, которая усложняет быстрый и точный поиск. Особенность поискового алгоритма Bing является его отношение к плотности ключевых слов. Если для успешного продвижения в других поисковых системах тексты сайта должны содержать от 5 до 8% ключевых слов, то Bing считает естественной плотностью ключей цифру в 3%. Таким образом, вероятность того, что по вашему запросу могут быть предоставленный ссылки на сайты, не содержащие нужной информации, повышается.

    Как и у конкурентов, в Bing есть возможность фильтрация выдачи по временному периоду, языку и региону.


    ЗАКЛЮЧЕНИЕ

    Интернет образует гигантское хранилище данных по всем отраслям человеческого знания. Виртуальные библиотеки, архивы, ленты новостей содержат огромное количество текстовых, графических, аудио- и видеофайлов – всемирная компьютерная сеть, предоставляет нам огромное количество открытой информации. И ориентироваться в этом информационном потоке, находить нужное – очень важно для человека 21 века.

    Мы ознакомились с такими видами открытых источников информации сети Интернет, как каталоги, базы данных и поисковые системы на частных примерах и рассмотрели, как происходит поиск информации в рамках данных ресурсов.

    Источники

    1) Статья «Сбор информации из открытых источников» [Электронный ресурс] // Всепоиск, 2015, URL: http://www.vsepoisk.ru/2009/03/blog-post_27.html (Дата обращения: 13.12.2016)

    2) Официальный сайт DMOZ [Электронный ресурс] // DMOZ, 2016, URL: http://www.dmoz.org/ (Дата обращения: 13.12.2016)

    3) Официальный сайт Каталог@Mail [Электронный ресурс] // Mail.ru, 2016, URL: http://list.mail.ru/ (Дата обращения: 13.12.2016)

    4) Официальный сайт Espacenet [Электронный ресурс] // Espacenet, 2015 URL: http://www.epo.org/index.html (Дата обращения: 13.12.2016)

    5) Статья «Ищем в базах данных» [Электронный ресурс] // Всепоиск, 2015, URL: http://www.vsepoisk.ru/2009/04/blog-post_08.html (Дата обращения: 13.12.2016)

    Прошло не так много времени с , а Международный консорциум расследовательской журналистики - ICIJ, на основании этих документов подготовил новый грандиозный "подарок" для коррумпированных политиков. Утечка секретных документов показала, как замешаны в сокрытии доходов в оффшорных зонах президенты больших и малых держав, их родственники и приближенные.

    Крупнейшая утечка документов панамской фирмы вскрыла коррупцию мировых лидеров
    В документах можно найти фамилии 72 действующих и бывших лидеров государств, включая руководителей, обвиненных в разграблении своих стран. В этом перечне присутствуют фамилии президента Украины Петра Порошенко, короля Саудовской Аравии, президента РФ Путина и его близких друзей , Башара Асада и лидера нации Азербайджана Ильхама Алиева.


    Директор ICIJ Джерард Райл (Gerard Ryle) заявил, что "утечка станет самым сильным ударом по оффшорам из всех когдалибо предпринятых". Видимо, кто-то действительно могущественный и осведомленный, нанеся удар по оффшорному бизнесу объявил войну коррупции, сокрытию доходов и отмыванию денег в мировом масштабе.

    Почему такой шум из-за панамских документов
    Позволю себе напомнить уважаемому читателю, что данный блог не о политике, а об информации и ее поиске на просторах Интернет. В данном случае эти вещи, конечно, переплетаются. Но, эта статья призвана лишь осветить неординарное событие с информационной стороны. Пока стоит шум и бурлит пена вокруг PanamaLeaks, постараемся проанализировать данное событие и его последствия.

    Следует сказать, что вывод средств в оффшоры, как способ ухода от налогообложения в своей стране, строго не является криминалом. Да - некрасиво, да - не патриотично, но не криминал. В тех странах где это разрешено. Все так, но если дело касается бизнесменов или актеров, как в случае с футболистом Лионелем Месси или актером-каскадером Джеки Чаном.
    (обновляется)

    Если найдена информация по интересующему хозяйственному субъекту, можно включить автоматический мониторинг изменений в реестрах, которые касаются данной компании или предпринимателя. Обновленная информация будет приходить на ваш e-mail. Разработчики сервиса не скрывают планов по развитию проекта. Планируется добавление аналитической информации: статьи в СМИ, репутацию субъектов предпринимательства на базе отзывов бизнес-партнеров, финансовый анализ, вероятность банкротства и пр.

    Конечно, слишком мало времени еще прошло, чтобы делать какие-то выводы по работе поисковика. Возможно,будут еще проблемы. Предвижу, например, противоречия, связанные с понятием коммерческой тайны. В общем, будем посмотреть, как будет развиваться проект и пожелаем удачи начинанию!

    Ссылки по теме:
    youcontrol.com.ua в ВКонтакте vk.com/public91977868
    в Facebook www.facebook.com/youcontrol.com.ua
    E-mail [email protected]
    тел. +38 066 189 02 06

    Ну и, как обычно, видео, комментарии к которому абсолютно не нужны.

    Как отмечает источник, выданная им в свет информация является лишь своего рода пробной порцией. Истинный объем данных, которые находятся в распоряжении журналистов намного больше. Таким образом, слова представителей журналистского консорциума о том, что тихий мир оффшоров ждет настоящее "землетрясение" представляются вполне правдоподобными.

    Совсем недавно французские разработчики представили на суд интернет-аудитории новую поисковую систему Qwant (qwant.com). Сами французы называют свой поисковик революционным. По словам соучредителя, Qwant – это одновременно целостная и непредвзятая система. Она предлагает информацию не делая никаких предпочтений в поисковой выдаче.

    Разработка Qwant шла в течение двух лет. Как признаются разработчики, главная цель новой поисковой системы – это перегнать и обогнать крупнейший поисковик Google. Итак, запущен qwant.com 13 февраля 2013 г. На данный момент проводится тестирование этой системы, и доступна она в 35 странах на 15 языках.

    Среди особенностей нового поиска – это распределение найденных результатов по категориям. Так, можно найти информацию по социальным сетям – это колонка Social или, например, пролистать данные из новостной ленты (Live). Столбец Web выводит самые популярные статьи по вашему запросу, а графа Shopping показывает коммерческую информацию о запрошенном вами продукте.

    По самой середине страницы находится столбец Knowledge Graph - там можно получить краткое описание вашего запроса – что это такое, где применяется и т.д – как описание в толковом словаре. Кроме этого, Qwant предлагает вывод изображений и видео по вашему запросу. Здесь также есть большое отличие от Google, Яндекс и прочих поисковиков, где для просмотра изображений по поисковому запросу нужно переходить на специальную вкладку.

    Qwant можно назвать одним из наиболее удобных по интерфейсу поисковиков. Он предлагает большое количество настроек для более удобного именно для вас отображения данных. Столбики категорий выдачи можно менять по расположению между собой. К примеру, если вас в первую очередь интересует новостная строка, ее можно передвинуть влево, чтобы она первой бросалась в глаза, а список с коммерческой информацией можно переместить максимально вправо.

    Проведем небольшое тестирование поисковика. Допустим, нас интересует творчество Моники Белуччи. Открываем стартовую страницу qwant.com, которая, к слову, по своему дизайну очень напоминает Гугл. Вводим в строку "Моника Белуччи" и видим следующее: в самом верху нам предлагаются видео и фото этой известной актрисы, при этом листать медиа-результаты можно прямо вверху при помощи стрелочки, не переходя на вкладку с фотографиями.


    В столбце Web мы видим ссылки на несколько наиболее релевантных сайтов, на которых есть информация о Белуччи – Википедия, КиноПоиск, и т. д. В графе Live – новости об актрисе (последние интервью, фотосессии и т. п.), в графе Social можно просмотреть отзывы людей о Монике Белуччи из социальных сетей, ну а в Shopping мы видим список сайтов, на которых можно приобрести фильмы с Моникой.

    Как можно видеть, система направлена на то, чтобы предоставить ответы на любой запрос пользователя, не навязывая пользователю при этом результаты, а предлагая их в нескольких категориях на выбор. Сами создатели Qwant подтверждают, что главный упор делался на то, чтобы улучшить поиск информации по популярным социальным сетям.


    Безусловно, облачные технологии являются платными, ведь вы используете сервера третьих лиц. Но такая услуга имеет большое количество преимуществ, в частности:

    Клиент должен платить только за тот объем памяти в хранилище, которое он реально использует, а не за аренду сервера;
    - клиенту не нужно приобретать, обслуживать и поддерживать собственное оборудование для хранения данных, благодаря чему сильно уменьшаются издержки производства;
    - все технические моменты касательно сохранения целостности размещенной информации и резервированию данных проводятся провайдером, который не требует в этом участия клиента.

    Чем привлекательны облачные хранилища данных
    Вы, наверняка, пользовались файлообменниками, которых и до сих пор существует огромное количество. Там можно было загрузить собственный файл, который становится доступным для любого пользователя, который может найти ваш файл по тегу или названию. В отличие от них, облачная технология обеспечивает полную конфиденциальность. То есть, пользоваться размещенными данными может только владелец информации, и заходит он в систему со своим логином и паролем.

    Рядовые пользователи полюбили такие технологии за то, что теперь не нужно засорять компьютер тоннами старой информации – на любом компьютере всегда можно найти несколько гигабайт старой музыки, которая может быть еще когда-нибудь пригодится, коллекцию фильмов, пересмотренных уже несколько раз, документов, которые уже были распечатаны и использованы.

    Но, тем не менее, всю эту информацию надо где-то хранить. Облачные сервисы предлагают очистить непосредственно место на компьютере, переслав все ненужные пока данные в "облако". Для этого нужно только быть готовым заплатить некоторую плату и иметь высокоскоростное подключение к Интернету.

    Еще одна особенность облачного хранения состоит в том, что получить хранимые данные можно в любой момент и с любого устройства. То есть, если вы отправили "в облако" фильм с компьютера, забрать его обратно к себе на компьютер вы можете с ноутбука, планшета, смартфона… Главное, чтобы при вас был пароль и логин.

    Какое облачное хранилище выбрать?
    Существует огромное количество облачных сервисов, и они постоянно развиваются, предлагая не только места для хранения данных, но и сопутствующие сервисы. Ниже приведу наиболее популярные из них.

    1. Windows Live SkyDrive – предлагает наибольший объем серверного пространства. Зарегистрированные пользователи могут бесплатно хранить в облаке до 25 Гбайт собственной информации. Документы Office, отправленные в облачное хранилище, можно редактировать и открывать прямо в браузере. Синхронизацию можно производить сразу с нескольких компьютерных устройств.

    2. DropBox – очень известный сервис среди обычных пользователей, но предлагает только по 2 Гбайта места для каждого своего клиента. Если же пользоваться платным аккаунтом, то можно расширить свои возможности до 20 Гбайт.

    Graph Search (далее GS) — так называется недавно анонсированый Цукербергом апдейт Facebook (FB), еще более "социализирующий" первую соцсеть планеты. Бета-релиз нового сервиса запущен пока лишь в англоязычном сегменте Фейсбука. Русскоязычным пользователям соцсети поисковое "ноу-хау" станет доступно позже, но в "лист ожидания" можно внести свой аккаунт уже сейчас.

    Технически GS представляет собой систему фильтров, использующих поисковый алгоритм Bing внутри соцсети и позволяющий искать людей, интересные места, музыку (в последующем апдейте), фотографии, релевантные вашим "фейсбуковым" интересам. Для пользователя "социалки" Graph Search будет выглядеть поисковой панелью наверху любой страницы FB.

    При введении в поисковую строку GS запроса, результат выдачи собирается на отдельной странице, носящей имя запроса (например: "Мои друзья в Рио"). Планируется поиск по "лайкам", комментариям, медиаконтенту, отметкам фотоснимков. Дата следующего апдейта интеллектуального сервиса пока неизвестна.

    Graph Search от Facebook — как это работает?
    Старт разработке дало утверждение: для пользователя рекомендация друга значимей оценок тысяч неизвестных людей. Так, с помощью Graph Search можно найти, например:

    Фотографии сокурсников до 1995 года;
    -любителей сквоша из вашего города;
    -фотоснимки друзей, сделанные в Индонезии;
    -любимые столичные суши-бары ваших друзей;
    -достопримечательности Праги или Парижа, посещенные вашими друзьями.

    Повод для беспокойства или ложная тревога?
    Первые новости о Graph Search вызвали у пользователей FB и некоторые опасения. Да, интеллектуальный сервис в плане возможностей поиска весьма привлекателен, но многие боятся использования социального поиска маркетинговыми компаниями, спецслужбами, криминальными группировками, госструктурами, недобросовестными владельцами интернет-сервисов для сбора информации. Обоснованы ли опасения?

    С одной стороны, Graph Search настройки конфиденциальности не меняет, следовательно "выдать" приватные данные может только пользователям FB, для которых они открыты. С другой — от "информационных утечек" страдают трансконтинентальные корпорации, правительственные интранеты и даже банки. Надежен ли Фейсбук в плане безопасности? Время покажет.

    Используемые методы сбора данных различаются в зависимости от вида проводимого исследования -- первичного или вторичного.

    В случае проведения вторичных маркетинговых исследований на первый план выступают методы поиска в Интернете необходимой информации. Основными инструментами ее поиска сегодня являются поисковые системы и каталоги. В ряде случаев, когда их использование не дает достаточного эффекта, применяется «ручной» поиск по тематическим сайтам, «желтым страницам» и ряду других ресурсов. Более подробно методы поиска рассмотрены в одном из последующих разделов этой главы.

    В случае сбора первичной информации основными методами сбора данных выступают интернет-опросы, наблюдение и эксперименты.

    Интернет-опросы -- наиболее широко распространенным методом их проведения является анкетирование. Анкета представляет собой набор вопросов, на которые должны быть получены ответы респондентов, то есть лиц, отобранных для анкетирования. Из-за того, что этот инструмент отличается большой гибкостью и универсальностью, он является наиболее распространенным средством сбора первичных данных;

    На рис. 3 представлен фрагмент анкеты, которую предлагается заполнить пользователям, решившим воспользоваться бесплатным сервисом электронной почты на сайте

    Рис. 3.

    Так же как и при проведении традиционных видов анкетирования, перед каждым интернет-исследованием необходимо тщательно разработать и протестировать используемые в нем анкеты. Непрофессиональный подход к их составлению неизбежно приводит к искажению реальной картины, либо полученные результаты не поддаются разумному истолкованию.

    Этому виду исследования посвящен один из дальнейших разделов настоящей главы с названием «Проведение интернет-опросов».

    Наблюдение -- представляет собой форму маркетинговых исследований, с помощью которых осуществляется систематическое, планомерное изучение поведения того или иного объекта или субъекта. Наблюдение, в отличие от опроса, не зависит от готовности наблюдаемого объекта сообщать информацию и является процессом открытого или скрытого сбора и регистрации событий или особых моментов, связанных с его поведением. Предметом наблюдения могут быть, например, характеристики и поведение покупателей;

    К этому методу относятся маркетинговые исследования, проводимые фирмами при наличии у них собственного web-сервера. Они состоят в сборе и последующем анализе данных, получаемых из файлов журналов (log files) web-сервера или благодаря использованию технологий с применением файлов cookie. Эти данные могут относиться к поведению посетителей, очередности их переходов по страницам или статистике посещений web-сервера. В случае размещения на сайте поисковой системы, дополнительно могут собираться и анализироваться вводимые пользователями запросы.

    Возможности анализа статистики посещений сервера являются одним из эффективных инструментов маркетинга. В отличие от проведения опросов, требующих активного участия респондентов, анализ статистики позволяет собрать ценную информацию, не привлекая посетителей к активным действиям.

    Эксперимент -- наиболее строгим с научной точки зрения является экспериментальное исследование, имеющее целью установление причинно-следственных связей. Объекты эксперимента должны быть специально отобраны и подвергнуты запланированным воздействиям в условиях контроля над внешним окружением, чтобы выявить статистически значимые различия в их реакции. В той же мере, в какой исследователям удается «отсечь» или взять под контроль не относящиеся к делу внешние факторы, наблюдаемые эффекты могут быть соотнесены с воздействиями экспериментаторов на объект. Устанавливаемые таким образом связи между событиями после их критического анализа могут считаться причинно-следственными, а цели эксперимента -- достигнутыми.