Media Times Review    Google   
___









Технологии
 април 2004

В търсене на бъдещето

Имахме нужда от отговори, и Google реагира на това.
Какво следва?

Джоел Ахенбах


В началото – преди Google – тъмнина властваше на земята.
 
     Лутахме се из библиотеки. Правехме допитвания до Световната Енциклопедия. Прелиствахме почти микроскопичните списъци на тежките издания на Readers’ Guide. Осланяхме се на слухове и мълви, на слабо обосновани мрънкания на хора, набедени за експерти. Предполагахме. Догаждахме се. Често се отказвахме, прекланяйки глава пред невежеството.
     Едва сега, в светлината на Google-ерата осъзнаваме колко мрачен и неясен е бил нашия пре-Google-иански свят. В по-далечното бъдеще може би историците ще използват следния термин за периода преди появата на Google: “Тъмните векове”.
     В последните години се наложиха много и добри интернет търсачки - Yahoo!, AltaVista, Lycos, Infoseek, Ask Jeeves … - но Google за пръв път се превърна в инструмент, в съществена част от социалната инфраструктура, подобно на парния механизъм, шевната машина и дори самия Интернет.
     Хората постоянно откриват нови начини за използване на Google. Вече е практика романтично настроените хора да ползват Google за уговаряне на срещи. "Google hackers" използва филтриращите способности на Google за извличане на банкови записи и номера на социални осигуровки.
     Преди около три години словосъчетанието “към Google” се появи в речниците на интернет потребителите, а от около година Google вече надмина всички конкурентни търсачки по брой на обработените запитвания – за момента тази цифра е повече от 200 милиона дневно. Този успех е толкова феноменален, че някои икономически наблюдатели са на мнение, че едно публично обявяване за продажба на Google на борсата ще бъде оценено на към 20 милиарда щатски долара и ще предизвика втори dot-com бум.
     “Когато направиш добър капан, светът сам ще намери пътя си до него”, казва за Google Стюарт Бранд, компютърен гуру и президент на Long Now Foundation. “По-отъпкан път никога досега не е правен в цялата история на света. Всичко това е една изумителна история.”
     В dot-com света нищо не остава постоянно за по-продължително време, и не е никак ясно дали Google ще успее да задържи своите доминиращи позиции пред такива съперници като Yahoo! и Microsoft. Но самата бизнес история на Google е дори по-малко интересна от технологичната й. Благодарение на Google значително по-лесно от преди можем да получим знания. Google работи. Google знае.
     В дългата история на света най-честата причина за неговата трансформация са били откривателските експедиции, религиозните движения, епидемичните болести, периодично плъзващи по земята, приумиците на владетелите и опустошенията на войните. Постепенно обаче, през вековете, технологията се превърна в основен носител на промяната, в нещо, способно да направи планетата ни по-малка и достъпна, да разклати основите на диктаторските режим и да превърне 14-годишни хлапета в издатели.
     Въпросът е, кой ще създаде следващия капан? В какво ще се изразява той? Лабораториите на интернет компаниите яростно се опитват да създадат следващо поколение търсещ механизъм. Какъвто и да е той, както и да се нарича, той ще направи сегашните Google алгоритми за търсене толкова старомодни, колкото ръчните манивели на автомобилите.
 
Мамо, какво е библиотека?
 
     Преходът към ерата на Google не бе извършен без причиняването на редица страдания. Лавиците в университетските библиотеки са доста празни. Заемането на книги от библиотеките спадна с около 20% в по-големите университети в първите пет години от повишаването на популярността на интернет търсачките. За голяма част от студентите, Google е мястото, откъдето започват всяко свое изследване, за една част от тях – то дори свършва там.
     Допреди само едно поколение библиотекарите – създания от плът и кръв – бяха най-мощния механизъм за търсене на информация на планетата. Но бумът на компютърните търсачки в средата на деветдесетте премахна необходимостта от човешкото посредничество между изследователите и информацията. Самите библиотекари не са толкова убедени в ползата от тази промяна. Много от данните в световната мрежа са грешни, или безумни, или пък имат недостоверни източници, или просто са остарели (което е малко странно за една толкова нова технология, но мрежата наистина е пълна със загубила давността си информация).
     “Как да удостоверим истинността на намерената от нас информация? Как да бъдем сигурни, че това не е някакъв съвсем аматьорски проект, публикуван в интернет?”, пита библиотекарката от American University Патриша Уонд.
     Обикновено студентите търсят само в най-видните портали и сайтове в интернет. Те рядко се осмеляват да се впускат в бродене из така наречената “тъмна част на мрежата”, намираща се извън оградените с високи стени градини от информация, достъпни само чрез определени бази от данни, като Lexis-Nexis или Oxford English Dictionary. А повечето стари книги остават недигитализирани. Library of Congress има над 19 милиона уникални екземпляра, плюс още около 9 милиона в нестандартни формати, като повечето от тях не са достъпни в интернет. Това би могло и да се промени, но за момента една огромна част от човешката мъдрост, от натрупаното през вековете познание, остава невидимо за изследователите, използващи само интернет.
     “За много от децата днес светът е започнал през 1996 година”, твърди писателят и библиотечен деец Гари Прайс.
     Професорът в Berkeley University Литър Лиман обаче отбелязва, че традиционните източници на информация, като печатните издания, все повече се подлагат на цензура от всевъзможни комисии, и са пълни с “компроментирана информация”. Той не е убеден, че роботизираните интернет търсачки дават по-лоши резултати от традиционните източници.
     “Доскоро бушуваше културна война между библиотекарите и компютърните специалисти.”, казва Лиман.
     “И добре, че тази война най-накрая завърши”, добавя той.
     “Google спечели.”
 
Специализирано търсене
 
     В ранните дни на интернет търсачките, откриването на информация донякъде наподобяваше риболова в канал: може и да се хванеш нещо добро, но се оставаш с усещането, че пускаш въдицата си в стара метална консерва или в стар галош. Сега вече намирането на точно необходимата информация е напълно реално.
     Една от причините за толкова стремглавото развитие на Google е, че автоматизираните търсачки на компанията имат огромен обем данни за изследване. Първоначално Goolge претърсваше около 20 милиона уеб страници; в момента на home страницата на фирмата с гордост е отбелязано, че заявките за търсене на информация обхващат 3,307,998,701 страници (към настоящата дата този брой вече е достигнал - бел. пр.).
     “През 1996 година, ако търсенето на информация с Google, ако Google изобщо съществуваше по това време, не би дало някакъв кой знае колко задоволителен резултат.”, споделя Сет Годин, автор на редица бестселъри за интернет. “Тогава бяхме изброили един критичен обем от наистина ценни online източници – и мисля, че числото беше някъде около 2000”.
     Експанзията на информационната вселена постепенно прави навигационните инструменти все по-ценни. И въпреки това първоначално алгоритмите за търсене на информация изглеждат само като едно лишено от чар и блясък компютърно приложение. Първите интернет търсачки - Yahoo!, Excite, AltaVista и Lycos – имаха желанието да се превърнат в нещо по-шик, в нещо, на което човек може да се удивлява, в своеобразни Интернет портални сайтове на века, предлагащи на потребителите си препратки към всевъзможна информация, обхващаща почти всичко от земята до Нептун.
     Но историята на компютърните технологии е пълна с компании, които не са били способни да видят блестящите потенциални възможности, изпречили се насреща им. В началото на 80-те, в IBM са считали, че е операционната система на компютъра е от второстепенно значение в сравнение с хардуера. Тогава от Microsoft не пропускат да се възползват от това недооценяване. Но пък се фокусират до такава степен върху софтуерната разработка, че се забавят в използването на интернет революцията като средство за натрупване на капитал. По този начин Netscape става първият комерсиален интернет браузер. Тогава пък почти всички подценяват значимостта на търсенето в интернет.
     Но не и Google. Когато компанията се появява на бял свят през септември 1998 година, всичко изглеждаше като връщане назад, към миналото на интернет. Сайтът нямаше нищо общо с идеята за портал. Заглавната страница представляваше едно голямо бяло пространство, и един малък правоъгълник с празно текстово поле в центъра му. Попълваш в полето и получаваш резултати. Това беше класическо, скучно, старомодно търсене, без кратки новини, оферти за самолетни билети, e-mail кутии, или някакви други екстри за посетителя.
     Но какъв успех! В момента Google има цели халета, пълни с едновременно работещи компютри. Човек може да напише няколко думи – и да получи над 600 хиляди резултата за безумно кратко време. (Google не пропуска възможността да се похвали с това: “Търсенето отне 0.17 секунди.” Фукльовци!)
     Google, творението на студентите от Станфорд Сергей Брин и Лари Пейдж, като цяло не се различава твърде много от останалите интернет търсачки. В основата са мощни софтуерни програми, които автоматично претърсват мрежата, проверяват всяка една препратка, разузнавайки терена. Това, което е специфично в Google, е идеята, при оценяването на качеството на даден сайт да се взема под внимание колко други интернет страници съдържат препратки към него. Това е стара идея от университета, наречена “анализ на цитата”. Ако множество страници препращат посетителите си към определен интернет сайт, то той се издига в широко прокламираната ранглиста на Google и възможността да се появява на първата страница с резултатите от търсенето се повишава многократно.
                      
Сергей Брин                                           Лари Пейдж
     “По този начин се търсят ползите на груповото съзнание”, казва Пол Сафо, изследователски директор в Institute for the Future.
     Това е ключова концепция: с разрастването си, световната мрежа развива една своеобразна собствена вградена мъдрост. Естествено, интернет не е съзнателна единица, но и същевременно не е напълно произволна купчина документи, идеи. Начинът, по който една негова част сочи към друга, рефлектира върху предпочитанията на интернет ползвателите – и Google взема това под внимание. По този начин, търсейки закономерностите в мрежата, Google успява да открива значимото в цялата тази лудост.
     Всичко това ни води до един от следващите големи скокове в развитието на интернет търсачките: откриването на смисъл в начина, по който даден отделен човек търси информация в мрежата. Казано с други думи, търсачките ще изучават запитванията на потребителите, техните интернет навици, и след време ще могат да персонализират целия процес на търсене на информация. За момента, нито Google, нито останалите интернет търсачки имат реални познания за своите потребители.
     Например, Сафо не е особено заинтересуван за нещата, които повечето хора търсят в интернет. Той е един от първите футуристи на Silicon Valley и с нежни чувства си спомня за дните от 80-те и началото на 90-те, когато интернет беше запазено място за технологичния елит, който публикуваше своите блестящи мисли в електронни бюлетини. Сега, всеки от трети клас нагоре има собствен e-mail адрес и се шляе в мрежата, все едно това е кварталното кръстовище. Резултатите от интернет търсенията влияят върху вкусовете на голяма част от обикновените американци, които все още обичат да се разхождат по долни гащи в домовете си.
     “Колкото повече хора ползват интернет, толкова повече той се превръща в необятна пустош, която всъщност наследява пустошта на телевизията. Не ме интересува какво търси в интернет мнозинството от хората, просто защото повечето хора са ужасно скучни и досадни.”, споделя Сафо.
     Той се нуждае от една по-добра интернет търсачка. Търсачка, която да знае, че той е голям мозък, технологичен гуру, а не осмокласник, търсещ информация за свое писмено домашно задание.
     “Тази концепция е свързана със изграждането на образи, модели на потребителите”, разказва Дан Грул от IBM. “В основата й лежи идеята компютрите да следят взаимодействията си с хората, и да се опитват да разберат техните интереси, нещо за самите тях.”
     Представете си версия на Google, която не изисква от вас да правите запитване. Тя вече знае какво търсите! Тя е изучила вашите навици, вашите мисловни процеси, вашите интереси. Тя е вашият секретар, вашият колега, вашият съветник, вашият интелигентен агент.
 
Агент 001101
 
     Никой не знае със сигурност как биха работили интелигентните агенти на бъдещето; ако се осмелите да пренесете предположенията си дори само няколко месеца напред, веднага попадате в една крайно мъглива и неясна територия. Но лесно можете да си представите, че този интелигентен агент би бил в състояние постепенно да възприема все повече и повече характеристики на вашето съзнание, така че да се превърне в нещо като ваша сянка, ваш дигитален двойник.
     Вероятно този дигитален двойник би могъл да превърне в стока за широко потребление, в нещо, с което се търгува. Представете си, че трябва да напишете съчинение за бъдещето на интернет търсачките. Не бихте искали да използвате вашия собствен слаб, занемарен, объркан, претрупан с безсмислена информация виртуален секретар за правенето на това изследване. Ще искате да изтеглите от интернет интелигентния агент на Бил Гейтс, или на Пол Сафо, или пък на Сергей Брин, за да ви помогнат да зададете по умни въпроси, да откриете най-добрите отговори.
     Вече съществуват примитивни интелигентни агенти. Amazon.com препоръчва книги на посетителите си въз основа на вашите предишни покупки, както и на преценките на хората, които са харесали същите книги, на които сте се спрели и вие. Разбира се, тази форма на кооперативно филтриране е все още съвсем грубо.
     Старши изследователят в Microsoft Ерик Хорвиц описва разнообразие от нови, все още невнедрени технологии, в които софтуерът е по-активен, повече реално съществуващ, а не само инертна последователност от кодове, чакаща подаваните от потребителя команди. Пример за тези нововъведения е програма, наречена от него IQ, съкращение от "implicit query" (“скрита заявка”).
     “Докато работите, ние продължаваме да формулираме заявки като фонови процеси, за които потребителят дори не подозира. Те се изпълняват съвсем тихо”, разказва Хорвиц.
     Хорвиц обаче е напълно наясно, че хората не биха искали да ползват програми, които са твърде натрапчиви, които постоянно се намесват в работата. Хората притежават ограничени възможности за съсредоточаване. По тази причина софтуерът, по думите на Хорвиц, “трябва да бъде надарен с този тип благовъзпитаност, който очакваме от добре възпитан колега.”
     Начинът, по който тези програми ще бъдат развивани в бъдеще, засяга директно въпроса за неприкосновеността. Защото в начина, по който хората използват интернет, се крие ценна информация, която те не биха искали да става достояние на други, нито пък биха искали дадена машина да обръща внимание на всяко място, което те посещават. Как да бъде създаден обаче интелигентен агент, който да знае кога да извърне поглед настрана? Как да избегнем “чудовищните възможности”, както ги нарича Хорвиц?
     Това, което всеки иска, е умерен, дискретен интелигентен агент, доближаващ се до идеята за класическия английски иконом. Той трябва да може да оказва съдействие в извършването на определени действия, да поема допълнителните работи без дори да му бъде подаван сигнал за това.
     “Не мисля, че това, което искаме, е машина за търсене”, казва Сет Годин. “Смятам, че хората се нуждаят от машина за откриване.”
     Открий, и направи. Разреши проблемите.
     “Когато говоря за интернет агентите, аз често използвам аналогията с туристическите агенти”, разказва Джеймс Хендлър, професор по компютърни науки в университета на Мериленд. “Когато се обръщам към моя туристически агент и му кажа къде искам да отида, той не ми казва: ‘Да, ти можеш да отидеш там’. Вместо това той ми дава няколко варианта за различни начини, по които мога да го направя. Той взема предвид неща, за които аз вероятно не съм се сетил. Дали ще се нуждая от кола? Ще ми трябва ли хотелска резервация? И след това агента ми прави тези неща вместо мен.”
     По принцип компютрите правят само това, което им бъде зададено. Те нямат изкуствен интелект, поне в класическия смисъл на термина. Те не притежават здрав разум. Грул, главният архитект на един нов продукт на IBM, наречен WebFountain, посочва, че нито един компютър никога не е научавал това, което знае всяко едно двегодишно дете.
     Един компютър, споделя той, лесно би се объркал от фразата “Томи удари едно момче със счупен крак”. Компютърът не може да разбере, че счупеният крак не би могъл да бъде инструмент, използван за атака. “Здравият разум, иронията – това са неща, трудно възприемани от компютрите.”, заключава Грул.
 
Семантични дискусии
 
     За да придобие здрав разум, мрежата трябва да премине началния период на себепознаване. Защото все още интернет не разбира сам себе си. В него се съхраняват тонове от информация, но почти никаква “информация за информацията”, известна също като “мета-данни”.
     Една интернет търсачка търси за зададени думи в една страница, като в идеалния случай в нея ще се съдържат закодирани етикети, които описват кой е написал материала, по каква причина, кога и за каква цел, дори в какъв контекст е било направено това.
     Хендлър обяснява този проблем по следния начин: Ако напишете в Google думите “колко крави в Тексас”, Google ще претърси индексираните в него сайтове за думите “крави”, “колко” и “Тексас”. Но въпреки това може да се окаже, че в резултатите не откривате наистина колко са кравите в Тексас. Типичната интернет страница, съдържаща думите “крави” и “Тексас”, няма много общо с волската демография. (Като първи резултат от това търсене, Google извежда статия, озаглавена “Минералното подсигуряване на кравите в Тексас” от Денис Хърд.)
     Понастоящем Хендлър, съвместно с изобретателят на световната мрежа Тим Бърнърс-Лий, работи по Semantic Web, проект, насочен към имплементиране на системни етикети с мета-данни към интернет сайтовете. Голямата цел е интернет да бъде направен по-лесен и удобен за търсене на информация: не само за хората, но и за компютрите. Нещо повече, търсенето ще надхвърли чисто текстовото съдържание и ще се насочи и към музика, филми и всичко друго, което може да бъде съхранявано в цифров формат. “Опитваме се да направим мрежата малко по-интелигентна”, казва Хендлър.
     Но Питър Норвиг, директор по качеството на алгоритмите за търсене в Google, посочва, че сегашната, основана на търсенето по ключови думи система, макар и тромава и донякъде зависеща от случайността, все пак работи, при това в голямата си част добре.
     “Част от тайната на този факт е в това, че ключовите думи са добър похват”, казва той. “В повечето случаи те се справят с това, за което ги ползваме.”
     В действителност милиарди долари за заложени в тази надпревара за откриването на следващия капан за интернет потребителите. И от Google са изправени пред сериозно предизвикателство. Дълго време Yahoo! имаше партньорски взаимоотношения с Google, като използваше тяхната технология за търсене. Но наскоро порталът закупи две други компании за интернет търсачки и очевидно планира да конкурира Google. Междувременно Microsoft се стреми да включи търсенето като основен елемент в следващата версия на операционната си система, която се очаква да излезе на пазара през 2006 година под названието Longhorn.
     Дали Google ще бъде изместен, също както Netscape?
     “Не се притесняваме от конкуренцията.”, твърди Норвиг.
     Технологиите създават един хоризонт, отвъд който съдбата на човека е неизвестна, защото не сме в състояние да предвидим всички луди неща, които гениалните хора могат да изобретят. Писателят Майкъл Крайтън подчертава, че през 1900-ната година, когато хората са размишлявали за света след 100 години, като голям проблем се е разглеждал въпроса би било възможно да се намерят достатъчно коне, така че да има за всички.
     И къде е щяла да бъде съхранявана всичката конска тор.
     Опитите за точни предвиждания обикновено се оказват грешни. Но през вековете ясно се е очертала една обща тенденция: информацията не може да бъде затворена. Информацията е била в състояние да се освободи от манастири, библиотеки, издателски къщи. В средновековието книгите са били закрепвани с вериги за писалищата. Сега вече информацията е напълно свободна.
     
 
Превод: Милен Недев

MTR Връзки
Феноменът на блога е може би едно от най-странните явления в интернет. По-странно дори от невероятния брой на съществуващите порно-сайтове. Хиляди иначе съвсем незабележими хора публикуват всекидневно своите дневници.
Ръсел Смит

Опитайте се за момент да забравите за месечните такси. Помечтайте си, че интернет Ви излиза толкова евтино, колкото и слушането на радио. Като единственото условие за това е да имате приятелски отношения със съседите си. Кореспондентът на BBC Марк Уорд Ви за познавава с една новаторска схема, която би могла да направи тази мечта реалност.

От 01.07 влиза в сила нова директива на ЕС, изискваща всички интернет компании да подават декларации за облагане с данък добавена стойност (ДДС) на така наречените "електронни продажби"
Агенция Reuters

Компютрите ни правят по-продуктивни. Но дали същевременно не ни и забавят?
Брадфорд Делонг

IT-журналистите критикуват свободния софтуер, понеже им напомнял комунизма и убивал бизнеса. Това е плодът на предразсъдъците. Да критикуваш нещо, което не познаваш, дори и то да заслужава тази критика, е несправедливо. Колко по-несправедливо е да крикуваш нещо, което не познаваш, а то на всичкото отгоре и не заслужава да бъде критикувано по този начин!
Никола Антонов