12-10-2023
Тип | |
---|---|
Разработчик |
Максим Захаров |
Написана на | |
Операционная система | |
Последняя версия | |
Лицензия | |
Сайт |
www.dataparksearch.org |
DataparkSearch Engine — поисковая машина с открытым исходным текстом, написанная на языке С. Распространяется по лицензии GNU GPL. Предназначена для организации поиска на одном или многих веб-серверах.
DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многие другие данные, используя внешние парсеры.
Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.
Использует собственную технологию ссылочного ранжирования, основанную на нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности, популярности, дате последнего изменения и по важности (произведению релевантности на популярность).
Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.
Поисковые машины (список) | |
---|---|
Общие | |
Региональные |
Accoona (Китай/США) • Alleba (Филиппины) • Ansearch (Австралия/США/Великобритания/Новая Зеландия) • Апорт (Россия) • Daum (Юж. Корея) • Guruji.com (Индия) • GoGo.ru (Россия) • Maktoob (Бл. Восток) • Meta.ua (Украина) • Miner.hu (Венгрия) • Najdi.si (Словения) • Onkosh (Бл. Восток) • Рамблер (Россия) • Rediff (Индия) • SAPO (Португалия) • Search.ch (Швейцария) • Sesam (Норвегия/Швеция) • Walla! (Израиль) |
…лидеры |
Baidu (Китай) • Naver (Юж. Корея) • Seznam (Чехия) • Yahoo! Japan (Япония) • Яндекс (Россия, СНГ, Турция) |
Тематические |
TinEye • Lexxe • Topsy • FindBook.ru |
Метапоиск |
AskNet.ru • Brainboost • Clusty • Dogpile • FarSEER • exactus.ru • Excite • HotBot • Info.com • Ixquick • Krozilo • Mamma • Metacrawler • MetaLib • Нигма • Myriad Search • SideStep • Surfwax • Turbo10 • WebCrawler • GlobalFileSearch |
Открытые |
DataparkSearch • Egothor • Gonzui • Grub • Ht://dig • locust • Isearch • Lucene • Lemur Toolkit & Indri Search Engine • mnoGoSearch • Namazu • Nutch • OpenFTS • Sciencenet (научная, на технологии YaCy) • Wikia Search • Sphinx • SWISH-E • Terrier Search Engine • Xapian • YaCy • Zettair |
Детские |
AGAKIDS (Россия) • Ask Kids (Великобритания) • Frag Finn (Германия) • Kids AOL (США) • Kids Yahoo! (США) • Quintura Дети (Россия) • Семейный Яндекс (Россия) • Гогуль (Россия) |
DataparkSearch.