Матриця для "Яндекса"
User Rating: / 0
PoorBest 
Sunday, 04 April 2010 17:47
There are no translations available.

Незважаючи на День дурня, «Яндекс» зібрав журналістів, щоб розповісти, що таке MatrixNet і як нова технологія вплинула на якість роботи пошукового движка і на частку «Яндекса» на ринку пошуку. Крім того, керівники «Яндекса» повідомили, які у компанії плани на майбутнє є, а яких - немає.

Було видно, що генеральний директор «Яндекса» Аркадій Волож і головний програміст компанії Ілля Сегаловіч дуже старалися. Вони розповідали, наскільки складна задача пошуку інформації в сотнях мільйонів веб-сторінок, як багато чинників при цьому доводиться враховувати, що в компанії працюють близько тисячі асесорів (не плутати з колезьким асесорами), які день у день оцінюють результати пошуку «Яндекс», що в компанії вже давно практикується машинне навчання (навіть дивно, що ніхто не жартував з приводу «Матриці»), а програмне забезпечення пошукового движка удосконалюється, щоб видавати більш релевантні результати.

Але пояснити журналістам, що зібралися в «Редіссон САС Слов'янська»,чим механізм пошуку, побудований на методі опорних векторів на основі розмірності Вапніка-Червоненкіса, відрізняється від розробленого Шапіро і Фрідманом і вдосконаленого Гулині і Карповичем методом boosting'a, здається, все одно не вдалося. Волож і Сегаловіч навіть показали фотографії всіх цих симпатичних математиків, але прес-конференція була дуже короткою, щоб розібратися, в чому полягає перевага «регуляризації значень в листах замість обмеження на кількість самплів на листіі».

Врешті-решт, вони витратили занадто багато сил на «Холодець» - зустріч зі студентами, майбутніми інженерами, програмістами і математиками (прес-конференція проходила якраз паралельно з цим заходом), де співробітники «Яндекс» пояснювали не тільки картинками, але і з формулами, на якій математиці зараз працює найбільша російська IT-компанія.

Загалом, залишається вірити «Яндексу» на слово: його пошук тепер базується на іншій, більш складній математичної моделі, яка передбачає врахування значно більшої кількості чинників для ранжирування за прийнятний час, тим самим роблячи пошук більш якісним.

Пошуковий движок «Снежинськ», що прийшов на зміну «Арзамас» («Яндекс» явно тяжіє до того, щоб долучитися до осколків радянського «ядерного архіпелагу») і базується на технології MatrixNet, з'явився не вчора. Його запуск відбувся ще 17 листопада 2009 року, що миттєво помітили і конкуренти компанії, і фахівці з веб-оптимізації, однак гучно оголошувати про цю подію «Яндекс» не став, вирішивши подивитися, якими будуть результати. За «внутрішнім відчуттям», тобто за власними критеріями, завдяки новій технології якість пошуку «Яндекса» виросло відразу на 5%.

«Внутрішнім відчуттями» компанії можна і не вірити, але якщо заглянути в статистику liveinternet.ru, то можна побачити, за чотири місяці - з грудня 2009 по березень 2010 - частка «Яндекса» на ринку пошуку виросла на 4%, досягнувши 62,9 % ринку. За той же період частка конкуруючих пошуковиків - Google і Mail.Ru - трохи знизилася. «Яндекс» вважає, що таким значним зростанням компанія зобов'язана саме MatrixNet.

Підвищення якості пошуку, звичайно, може призвести до зростання числа користувачів - тільки чи так швидко? У користувачів є свої звички, які, як і всякі звички, вони не схильні змінювати так швидко. Судячи з ненульовою частки Rambler, є ненульова кількість користувачів, які не готові змінити свої звички, незважаючи ні на що. З іншого боку, кардинальна зміна пошуку на Mail.Ru, наприклад, який більше не обслуговується «Яндексом», могло призвести до збільшення частки останнього на ринку дуже значно: розчаровані звичними результатами, користувачі головного російського поштовика могли звернутися саме до «Яндексу». До речі, здивовані рішенням Mail.Ru були не лише користувачі, але й, за словами Аркадія Воложа, сам «Яндекс». Настільки здивований, що навряд чи зважиться повернутися, навіть якщо Mail.Ru «одумається» і покличе назад.

Планів обслуговувати пошуковий сервіс Mail.Ru у «Яндекса» тепер немає. Немає і інших планів. Наприклад, купувати ICQ: не так давно ЗМІ активно обговорювали перспективи цієї все ще популярної в Росії служби миттєвих повідомлень «продатися кому-небудь», і «Яндекс» фігурував серед головних претендентів на найгучніше придбання. Але з математикою у «Яндекса», судячи з MatrixNet, здається, все нормально, тому 1% пошукового трафіку від ICQ компанії досить. «А більше нам нічого й не треба», - радісно зауважив Аркадій Волож. І в цей момент він нагадував людину, якій спробували втюхати китайський портативний пилосос для автомобіля, але він вдало уникнув безглуздих витрат.

До речі, про китайців. Незважаючи на те, що у «Яндекса» досить серверів і математиків, немає у нього і планів виходу на китайський ринок. Google з Китаю, мабуть, йде, і під боком у Baidu.com звільнилося місце для другого пошукача. Але скористатися цим шансом «Яндекс» не збирається і в Китай не прагне: того рівня державного регулювання ринку, який є в Росії, йому, судячи з усього, вистачає вище даху, і прориватися через Велику китайську стіну китайської бюрократії йому явно не хочеться. «Яндекс» готовий допомогти Baidu.com з математикою: технології головного китайського пошуковика знаходяться на рівні, що не надто відрізняється від Infoseek десятирічної давності. Але не більше того.

Крім планів, яких у «Яндекса» немає, є в нього плани, над реалізацією яких він активно працює. Ілля Сегаловіч розповів пожвавішим після презентації MatrixNet журналістам, що розробники «Яндекса» трудяться над технологіями розпізнавання мови. Більше того, вже в цьому році такі функції з'являться у користувачів мобільних додатків компанії. Займається «Яндекс» і розпізнаванням образів. Недалеко той день, коли простий російський громадянин, проходячи по Тверській і виявивши там пам'ятник невідомому поету, зможе навести на нього об'єктив телефону і MatrixNet «Яндекса» миттєво визначить, що це, і правда, Пушкін.

Добре, що визначить, а не намалює. Загалом, навіть щастя, що MatrixNet, незважаючи на використання boosting'а, - це ще не Матриця.

Автор Володимир Харитонов

Джерело: tv.net.ua

 
>
BookNewsPractice SearchPartnersAbout
Підтримка та дизайн: Могильний С.С. Шаблон: Joomla Templates by BuyHTTP Joomla Hosting