Home ¦ Language Register ¦ Maps ¦ Paedia ¦ Страны мира ¦ Publications

LINGUARIUM: ePrint Archive in Linguistics

Материалы к созданию веб-Архива по лингвистике

Начало ¦ Информация ¦ Стартовая страница ¦ Процесс выкладки ¦ Предметные рубрики ¦ Рубрики по языкам ¦ User info

1 2 ноября 2004 года на эл. рассылке Mosling началось обсуждение возможностей создания электронного веб-архива для хранения работ по лингвистике. В процессе обсуждения ему было присвоено рабочее название Linguarium. Практически все детали были обсуждены, был найден софт и человек, способный его настроить, было куплено доменное имя и проплачен хостинг и вот-вот казалось, что архив будет запущен. Но по независимым от нас обстоятельствам этого не произошло. Однако все наработки остались и теперь не хватает лишь человека, способного заново все настроить, и его же или другого человека, способного организовать хостинг. Мой адрес внизу – пишите. А здесь я выложу наработанные материалы, чтобы пока любой желающий мог ознакомится, понять сможет ли он чем-то помочь или просто высказать свои замечания.

Веб-архив – это сайт со специально настроенным софтом, позволяющим авторам самим выкладывать свои работы, а всем желающим их легко находить и смотреть.

Создание электронных общедоступных архивов – характерная тенденция развития современного научного сообщества. Одним из первых архивов такого рода стал архив по физике, математике и смежным наукам (http://arXiv.org), существующий с 1991 года и хранящий к настоящему времени более 340 тыс. работ. Этому примеру активно последовали другие естественные и точные науки, а вот гуманитарные науки до сих пор сильно отстают. Так, в мире не существует единого архива по лингвистике, хотя имеется несколько небольших архивов по отдельным лингвистическим теориям, например по теории оптимальности (http://ruccs.rutgers.edu/roa.html), синтаксической минимальности (http://www.minimalism.arizona.edu) или грамматике зависимостей ( http://ufal.mff.cuni.cz/dg/dg-bib.html). Однако архивы в силу своей специфичности охватывают лишь очень незначительную часть работ по лингвистике. В России не существует архивов по гуманитарным наукам, а ученые ествественных и точных наук пользуются международными архивами. Крупные международные архивы сделаны на основе последних научных достижений, с возможностью полнотекстового и многополевого поиска и пролистывания. Архивы по отдельным лингвистическим теориям, будучи не очень большими, обходятся, как правило, без специального программного обеспечения и представляют из себя страницу со списком имеющихся работ. Архив, который предполагается создать, будет нацелен на гораздо большую аудиторию и по своей технической и программной оснащенности будет следовать наиболее крупным проектам.

Можно посмотреть: будущую начальную страницу, Информацию об архиве, тематический рубрикатор, языковой рубрикатор, описание процесса выкладки работы в архив. На всех страницах красным отмечены места, про которые я не уверен или которые нуждаются в доработке, а желтым - то, что требует внимания программиста.

 

Область знаний: архив посвящен лингвистике во всей широте ее проявлений, вплоть до смежных дисциплин (подробнее см. рубрикатор).

 

Региональность: изначально предполагалось, что архив будет посвящен преимущественно отечетсвенному языкознанию, но изучение ситуации на рынке архивов привело меня к (слегка безумной) идее создать Общемировой архив по лингвистике, поскольку как выяснилось лингвисты оказались в хвосте планеты всей и до сих пор не создали ни одного подобного архива. Физики, например, уже почти 15 лет архивят почти 100% своих работ (уже ок. 340 тыс.) и это безусловно весьма благоприятно сказывается на развитие физики. Но не все сразу и пока мы начнем с российской лингвистики. А там уж, как Бог даст.

Хостинг: мы готовы рассмотреть любые возможности долговечного и вместительного хостинга либо при каком-либо институте, либо еще где-то.

Софт: наиболее перспективной кажется возможность использования бесплатного софта, специально разработанного для создания е-архивов (см. http://ePrints.org ), что практически и было сделано зимой 2005 г. Если удастся это завершить, то решит сразу большое количество проблем. ….. В частности это ПО обеспечивает следующие вещи:
1. Поддержка метаданных (рубрики и прочее) для хранимой информации
2. Поддержка реестра пользователей
3. Поддержка автоматической публикации через веб-интерфейс
4. Поодержка рассылок об изменениях, добавлениях
5. И конечно, поиск как по содержимому, так и по метаинформации.

Демо-версию архива, работающего на ПО ePrints, можно посмотреть по адресу: http://demoprints.eprints.org/.

Процесс подачи работ: после установки указанного софта, опубликовать работу в архиве сможет сам автор. Для этого нужно будет единожды зарегистрироваться (см. анкету при регистрации), и с помощью простого и понятного интерфейса в несколько шагов предоставить необходимую информацию о работе, дать аннотацию и ее саму загрузить. Конечно останется возможность послать работу вместе с необходимыми сведениями администратору архива (т.е. пока мне), с тем чтобы он сам ее постил. Но лучше этим не увлекаться J.

Цитирование: формат цитирования см. на странице с Информацией.

Тип работ: публиковать в архиве предполагается любые виды лингвистических работ. Были разработаны подробные тематический и языковой рубрикаторы, которые будут использоваться при помещении работы в архив. По самим рубрикам будет возможен поиск и пролистывание.

Формат: поскольку архив предполагает самостоятельную публикацию работ автором, участие администрации архива в оформление работы практически исключается. Тем не менее, список форматов будет ограничен и все авторы призываются публиковать свои работы как минимум в pdf, а остальное по желанию (html, doc, ppt, xls, txt, etc.). Если перевести в pdf автор сам не может, присылайте админу.

Аннотацию должен давать сам автор, либо в процессе автоматического опубликования, либо присылая работу админу. А также предоставить список ключевых слов (по ним будет вестись поиск).

Поиск: как уже упоминалось ПО от еПринта поддерживает разнообразный поиск. Я надеюсь, что поиск будет возможен как минимум по следующим параметрам: полнотекстовый, по названию, по автору, по аннотации, по теме, по ключевым словам, по дате публикации, по месту публикации, по языку, по типу работ, по статусу работ….

Навигация: если Вы не знаете что именно искать, а просто хотите посмотреть что есть, – можно будет просмотреть (browse) архив по рубрикатору, годам публикации и авторам в алфавитном порядке.

Об отношениях с журналами, где опубликованы статьи: как показывает зарубежный опыт (а мне кажется у нас все должно быть еще проще), обычно журналы не возражают против помещения статей, в них опубликованных, в открытые архивы (им самим от этого только польза). Подробнее см. на странице с Информацией.

Почему надо помещать свою работу в архив:

Опубликованную: Достаточно очевидно, что публикация сборника статей или монографии сейчас далеко не гарантирует того, что с сочинением ознакомится большая аудитория: книги стоят дорого, а за пределами Москвы и Петербурга их обычно никто никогда не видит. (То же верно и относительно книг, печатаемых за пределами Москвы и Петербурга, которые до двух городов федерального подчинения доходят плохо.) Большого коммерческого интереса для автораиздание книги обычно не представляет, поэтому свободный доступ к публикации в интернете не ущемит ничьих прав и будет только способствовать научному общению.

Неопубликованную: Журналов у нас не так много, опубликоваться в них не так просто. Да и читают их не так чтобы все. Опубликовать книгу еще сложнее, купить ее - денег стоит, да они и мало доступны, особенно вне Москвы-СПб. А писать статьи/ книги в ящик - какой смысл?, а так много людей прочитает, свои соображения выскажут. Ведь она будет бесплатно доступна потенциально неограниченному числу интересующихся исследователей..

 

This page is a part of Lingvarium project website www.lingvarium.org

 

Supported by Linguistic Community & piligrim-expo Mastered by: Yuri Koryakov e-mail: lingvarium @ gmail.com

Created on November 14, 2005 ¦ Last updated on Jan, 14, 2008 17:54