Google Books определил общее число наименований книг в мире

07
Google Books
Как известно, проект Google Books — один из наиболее амбициозных проектов современности. Создать единую базу книг в электронном виде — серьезная задача, которая осложняется необходимостью договариваться с авторами, издательствами и прочими правообладателями. Данный проект интересен во многих смыслах — социальном, технологическом и логистическом. Влияние его на современное общество также имеет место быть, хотя на данный момент это влияние не такое сильное. Но речь не об этом. Дело в том, что создатели проекта постарались подсчитать каждую книгу в мире (имеется в виду не общее число книг, а общее число наименований книг). Понятно, что при таком подсчете погрешности неизбежны, но все же на Google можно надеяться. Так вот, получившееся число огромно — выходит 129864880 наименований.

К сожалению, методы подсчета книг, используемые специалистами, не особо афишируются. Известно только, что использовались различные каталоги, подавались запросы в университетские библиотеки, общественные библиотеки, частные коллекции, музеи и другие организации. Создание надежного алгоритма для отделения «зерен от плевел» — сложная задача, но похоже, что Google справился ис этим. Конечно, нужно было продумать алгоритмы для сортировки, классификации и анализа количества книг — это сложная, комплексная система алгоритмов, о которой хотелось бы узнать побольше.

Вообще говоря, подсчет был произведен не из праздного любопытства, а для того, чтобы оценить реальные масштабы проделанной работы в рамках проекта, плюс оценить усилия, которые придется приложить для продолжения и (если это вообще возможно) завершения проекта.

При подсчетах количества книг корпорация чаще всего использовала в качестве источника информации разнообразные ISBN каталоги, которые существуют примерно с начала 60-х годов прошлого века. Интересно, что при анализе были найдены погрешности в наименованиях каталога — около полутора тысяч книг получили одинаковый идентификатор, о чем сотрудники Google уже известили библиотеки, в чьи каталоги закралась ошибка.

Интересно, что вначале у Google при подсчете получилась цифра, близкая к миллиарду. Однако после удаления всех копий и дубликатов, число книг сократилось до 600 миллионов. После проведения еще более тщательного анализа конечная цифра достигла значения 129864880. Интересно было бы узнать, сколько информации содержится в подобной массе книг, в количественном выражении. В общем и целом, интереснейшее исследование команды разработчиков Google, которое успешно окончилось. Кто там книголюб — можно уже начать собирать полную коллекцию в печатном варианте :-)

По материалам: HabraHabr


Добавить комментарий


Защитный код
Обновить

« Пред.   След. »
Приснился сон, хочешь расшифровать сноведение сонник Юноны подскажет и поможет.
Questra Holdings atlantic global отзывы и кого обманули.


Каким будет My.com. от Mail.Ru Group Будущий международный проект Mail.Ru Group обещает быть интересным. Про некоторые подробности проекта стало известно....Readmore


LifeHack - взламываем мироздание


Все что с нами случается – это все изменения к лучшему.

Я придерживаюсь мнения что все что происходит вокруг нас – это изменения от которых будет только в «плюс» - ...



LifeHack – 10 правил Удачи

На блоге вводиться новый раздел LifeHack . Туда вошли статьи которые уже публиковались на блоге:      ...



Теоретические seo вопросы


Комплексное продвижение от All-reg.Net

В наш двадцать первый век сложно представить жизнь без интернета. На сегодняшний день сайты стали настолько обычным явлением, ...



Facebook тянет из Google топов

На сегодняшний день продукты Faceebook возглавил новый директор. Том Стоки стал новым экс-директором для управления продуктам...



Авторизация

Вход / Регистрация

загранпаспорт 10 дней

Заработок в интернете — это не миф, а реальность, но работать для этого надо много и упорно. Есть ли заработок в интернете, нет ли заработка в интернете Вы не узнаете пока сами не начнете работать и зарабатывать в интернете.

Блог SEO Философа Bormaley

Twitter Bormaley

В SEO денег НЕТ

При цитировании и использовании любых материалов гиперссылка на сайт Bormaley.com обязательна. Републикация авторских материалов возможна только после письменного согласования.
0

Статистика