Новости
2009-07-28 Под атакой
Зеркало сайта на rj.vlexo.net подверглось
атаке со стороны неизвестных лиц. В результате лимит трафика в 6 Гб был
исчерпан в считанные часы, и зеркало недоступно в настоящее время. Это при
том, что легитимное использование сайта использует 150-200 Мб трафика в месяц.
Поверхностный анализ показал, что атака велась с большого количества хостов
одновременно, и, по-видимому, имела своей целью обнаружение SQL-injection
уязвимостей в программном обеспечении сайта. Имела место уязвимость или нет, и
нанесен ли и какой ущерб базе данных, в данный момент выяснить не
представляется возможным. Все данные с сайта имеют резервную копию, поэтому
непоправимого ущерба, конечно же, нет, но зеркало останется недоступным до
конца июля.
Кстати, спешу принести свои извинения в связи с тем, что второе зеркало yaru.info оказалось пребывающим в нефункциональном
состоянии уже в течение трех недель с последнего сбоя сервера. Ошибка
конфигурации исправлена и сервер снова в строю.
2009-04-23 Новые источнки
К источникам, по которым производится поиск на сайте, добавлены два новых:
- ロシア語基礎7000語
— словарь, составленный дружественным нам японским товарищем под
псевдонимом Knephin Steg.
- Тематические
словари Van'а — списки слов на темы: животные, насекомые, птицы,
ягоды, лес, деревообработка, составленные товарищем Van'ом.
Обновлённый отчет о количестве слов на странице о сайте.
2004-04-17 Локализация
Кнопки в форме поиска слов теперь надписаны только на одном языке: на русском
или на японском, в зависимости от того, с какой главной страницы вы начали
поиск. Звёздочка в поле поиска теперь означает пропущенную часть слова.
2009-04-14 Реорганизация
Сайт подвергся небольшой реорганизации. В частности, японский и русский
текст больше не смешаны, а информация про сайт и проект разделены.
Кстати, раз уж сайт и русско-японский словарь — это два разных проекта,
то у них должны быть разные имена! Посему, сайт теперь называется «ЯRу»,
а старое имя «RJ» остаётся за русско-японским словарём.
2009-04-13 БЯРС
В базу словарных данных добавлен БЯРС — Большой японско-русский словарь
под редакцией Конрада, пока только в японско-русском направлении.
2009-03-17 Соратники!
Соратников прибывает. Многострадальный проект оцифровки Конрада выдал на-гора
очень приятный и удобный в обращении сайт для поиска онлайн (Большой японско-русский словарь под редакцией Н.И.Конрада), а Вадим
сотоварищи превзошёл самого себя и от словарей перешёл к разработке машинного
японско-русского переводчика (ЯРП — машинный онлайновый японско-русский переводчик). От души желаем
удачи и ждём дальнейших продвижений.
2009-03-13 В ряду соратников прибыло! ;)
Иероглифический словарь Яркси обзавёлся
веб-версией. Любоваться чудом можно здесь: Яркси-онлайн. Веб-версия максимально
повторяет интерфейс программы для PC, поэтому остаётся примерно настолько же
удобной (неудобной) в использовании, как и оригинал. В любом случае, наши
поздравления!
2009-03-05 Форма отзывов и сообщений об ошибках в словаре
На страницы результатов поиска справа снизу добавлена новая ссылка: Feedback.
Используя эту ссылку, можно открыть форму для отзывов и сообщений об ошибках.
Для указания ошибочного текста достаточно выделить его мышкой, и он
автоматически будет скопирован в текстовое поле. Разумеется, можно добавить
к отзыву ваши комментарии и предложения, или даже ваши варианты переводов.
Обработка поступивших отзывов и предложений производится вручную вашим покорным
слугой, благо их пока немного.
Единственная просьба для желающих присылать новые переводы: ни в коем случае
не копируйте текст буквально (cut&paste) из источнков, защищённых
копирайтом.
2009-03-02 И снова про ошибки
В настоящее время рассматриваются варианты автоматизированного приёма сообщений
об ошибках, но, к сожалению, ещё ничего не готово. До тех пор пишите на
rj.dict@gmail.com
и я постараюсь учесть ваши замечания и исправить замеченные ошибки.
Спасибо!
2009-02-17 Ошибки морфологии
К сожалению, морфологический движок ещё совсем слабый, и время от времени
выдаёт полную чушь. Скажем, слова «летей» и «старш» не являются грамотными!
Приношу свои искренние извинения за неточности.
2009-01-21 Дождались!...
Наконец-то появилась модель электронного словаря («дэнси-дзисё», 電子辞書)
с русско-японским и японско-русским словарями:
Casio Ex-word XD-SP7700, ロシア語モデル. Стоит удовольствие
немногим больше 4 манов, что по-нашему будет 15 тыс. рублей. Однако же,
за такие деньги дешевле купить небольшой ноут и водрузить на него
тучу словарей. Но всё равно приятно ;)
2009-01-20 Ай да Гайгодай!
Сегодня наткнулся на столь же непривычное, сколь радующее взгляд зрелище:
ロシア語辞書 —
русско-японский словарь, составленный японцами.
Словарь разработан на кафедре корпусной лингвистики Токийского Университета
Иностранных Языков (東京外国語大学). Ориентирован на японцев, начинающих и
продолжающих изучение русского языка. Средний по объёму (более 10000 слов),
качество переводов среднее, иногда общая и разговорная лексика смешаны без
дополнительных помет.
2009-01-12 Долгая тишина
Долгая тишина вовсе не означает, что проект заброшен. Слова копятся,
идеи варятся, и время от времени что-нибудь да и появляется новенькое.
Вот, число слов в RJ уже добралось до 2596, а вместе с другими
источниками уже набралось около 29 тыс. слов и 39 тыс.
словосочетаний.
Русско-японские словари можно скачать в формате Stardict.
2008-09-18 Описание формата словаря RJ
Выработанный в результате двух месяцев работы над словарем подход
к составлению переводов сублимировался в виде текста на странице
описания словаря.
2008-09-14 Автомобильный словарь с сайта Yakusite.ru
Похоже, что переводчики автоаукционных листов вполне могут оказаться
среди посетителей этого сайта, и в связи с этим к источникам был добавлен
словарь по автоаукционам с сайта yakusite.ru.
2008-09-09 Список рассылки для обсуждения RJ
Если у вас есть какие-нибудь вопросы или замечания
по поводу словаря RJ, сайта http://rj.vlexo.net
или же просто хочется поболтать про японский или русский языки,
добро пожаловать в rj-interest@googlegroups.com.
Добавление от 2009-12-10
Поскольку никто группой не пользуется, а спам собирать нам ни к чему, группа
была удалена
2008-09-02 Новый словарь с сайта perevod.jp
Спасибо большое Саше Першину
за предоставленные словарные данные с сайта perevod.jp. Обновлённый отчёт лежит на прежнем месте.
2008-09-01 Новости после каникул
Возвращение с каникул сразу же принесло не очень приятный сюрприз:
19 августа с сервера был деинсталлирован Ruby, и с тех пор поиск по
словарю не работал. Что ж, ftp пока еще не выключили, так что перейдем
на свою локальную инсталляцию.
2008-08-14 Обновление словарей в формате Stardict
Тем временем, RJ вырос до 2100 статей, а источники
пополнились словарем Яркси.
В связи с чем предлагаю вашему вниманию обновлённые словари в формате Stardict:
- RJ — русско-японский словарь RJ, 2100 слов
- RJ-all — русско-японский словарь, скомбинированный из доступных источников,
62341 слов и словосочетаний.
2008-08-13 Яркси
С милостивого разрешения Вадима Смоленского
в систему поиска добавлен "развёрнутый" в русско-японскую сторону
словарь Яркси. Словарь происхождением
своим ведёт к EDICT'у,
который группа добровольцев во главе с Вадимом перевела на русский язык.
Слова, помеченные 《!》, были переведены добровольцами и ещё не проверены
Вадимом лично, а посему могут содержать неточности и ошибки.
Кстати, конвертация словаря Яркси в удобоваримую (для меня ;) форму оказалась
настолько интересным предприятием, что я готов поделиться скриптами, если
кому-то вдруг покажется интересным.
Прокомментирую ещё, почему словарь в формате Stardict может оказаться
полезным даже при наличии словаря в сети. Stardict, подобно денси-дзисё, при
поиске слова выдает список схожих с ним слов, или слов, которые бы оказались
рядом в обычном бумажном словаре. Это очень помогает, потому что при поиске
одного слова сразу же видны все словосочетания, в которые это слово входит
первым. В сетевом словаре такой функции пока нет, и в ближайшем будущем
не предвидится.
2008-08-12 Хакусуйся
Давеча купил краткий русско-японский (18000) и японско-русский (6000)
бумажный словарь издательства Хакусуйся. Пристальное изучение русско-японской
части выявило, что я с многими идеями авторов Хакусуйси нахожусь в полном
согласии. А именно: (а) для наиболее употребительных слов приводятся
выклонения-распряжения, то есть ссылка со склонённого или спряжённого слова на
его словарную форму; (б) глаголы даются парами, совершенного и несовершенного
вида, правда, в Хакусуйсе несовершенные ссылаются на совершенные, а у меня
совершенные на несовершенные. Есть у Хакусуйси и достоинства, до которых мне,
как до луны, как, например, примеры употребления слов в японских и русских
предложениях. А есть и особенность, над которой кроме как хмыкать, ничего не
остаётся: ко всем русским словам приведено их чтение катаканой. По-моему,
катакана совершенно излишня, точно так же, как и написание японских слов
кириллицей. Если уж браться за язык, то по-взрослому ;)
2008-07-24 Русско-японский словарь для Stardict
По случаю юбилея RJ в 2000 слов (ой, в результате редактирования количество
уменьшилось до 1999) выложил промежуточные результаты работы в виде
подключаемых словарей для StarDict.
- RJ — русско-японский словарь RJ, 1999 слов
- RJ-all — русско-японский
словарь, скомбинированный из доступных источников,
12737 слов.
Комбинированный словарь составлен из разнообразного материала и слегка страдает
от несообразного форматирования. Из-за разнообразия источников лицензионный
статус его определен не слишком четко. В связи с чем прошу пользоваться им
только как словарем непосредственно, и воздержаться от распространения
модифицированных версий.
2008-07-23 Находка
Проект все еще находится в младенческом состоянии, и мне никак не удаётся
перестать беспокоиться «и начать жить». Поэтому, я регулярно посматриваю
в журнал посещений сайта, чтобы посмотреть, какие слова ищут посетители,
и каким образом они выходят на сайт RJ. Есть интересные тенденции. Например,
в первые дни после публикации сайта подавляющее число посетителей приходило
по ссылкам из сообщений, которые я опубликовал в mixi и в ЖЖ. В последнее
время приходят по 1-2 человека в день, найдя сайт в googl'е. И
в результатах поиска, в которые RJ каким-либо образом удалось затесаться,
время от времени попадаются крайне любопытные кусочки информации.
Скажем, сегодняшний запрос
russia japan slovar. В нем первой строчкой упоминается
нечто,
о чем знай я раньше, ни за что бы не принялся за составление своего словаря.
И вполне возможно, что приобретённое знание таки и приведет к безвременному
прекращению работы над словарем (хотя копаться в словарях и прикладывать свою
руку к великому делу приобщения японцев к русскому языку или же русских к
японскому, надо сказать, оказалось на удивление затягивающим занятием).
А нашлось там не что иное, как CDROM со словарем, который можно впихнуть
в дэнси-дзисё Casio, что, собственно, и является конечной целью
моей деятельности вокруг RJ.
2008-07-17 Поиск сразу нескольких слов
По случаю большого количества запросов словосочетаний теперь поиск проходит
не только по словосочетанию целиком, но и по отдельным словам.
UPD Правда, результаты поиска по некоторым словосочетаниям,
типа "до свидания", могут оказаться удручающе многословны, и не вполне понятно,
помогает ли дополнительная информация пониманию, или, напротив, мешает.
2008-07-14 Пополнение словарной базы
С милостивого разрешения товарища Антонова в систему поиска добавлено еще два словаря:
Zulpiqar и Глосса. Zulpiqar содержит иероглифические переводы без каны,
а Глосса, напротив, только фонетические переводы в «графике киридзи».
Суммарное количество слов и уникальный вклад всех использованных словарных
баз можно посмотреть на странице использованного словарного
материала.
2008-07-13 Ввод русских букв
По просьбе трудящихся добавил к форме ввода слова виртуальную клавиатуру.
2008-07-10 Японско-русское направление перевода и латиница
Я заметил, что многие посетители сайта ищут переводы японских слов, иногда
даже используя латиницу (ромадзи).
К сожалению, японско-русское направление перевода в данный момент совершенно
не проработано, поскольку моей главной целью является русско-японский словарь.
Однако, «посетитель всегда прав», поэтому я постараюсь что-нибудь придумать.
Также интересным представляется вопрос, как японцам вводить русские буквы при
отсутствии их на японской клавиатуре. Будем думать.
お客様にお願い致します。どの小さなコメントで有っても、気軽に
ゲストブックにお書き下さい。
Мне очень интересно с вами познакомиться. Если вы не против — то и
подружиться. Пишите, что вы думаете о словаре, о сайте
и о затее в целом. Жду ваших отзывов!
2008-06-31 Хостинг глючит
Не успел я нарадоваться на скорость доступа по FCGI, как провайдер сглючил
и перестал запускать FCGI. Придется откатиться обратно на CGI...
2008-06-30 Опять про кодировку
Вчера был отмечен первый случай запроса слова в кодировке cp1251. По этому
случаю в поисковый движок была добавлена соответствующая функция.
2008-06-26 Ускорение поиска
С настоящего момента Ruby-on-Rails работает через интерфейс FCGI, а значит,
сервер запускается заново не для каждого запроса. Поиск в словаре
с моего компьютера ускорился с ~1.5 секунд до 0.25 секунды.
2008-06-23 Новый источник словарного материала
Количество слов в RJ выросло до 1403. В систему поиска добавлен еще один
словарь, Yakusite.ru, около 3950 слов.
Общая статистика: всего слов в объединенной базе данных: 11448, при этом
вклады уникальных слов из разных баз таковы: jr-edict (5787), yakusite.ru
(2425), RJ (842), ru.wiktionary (216), ja.wiktionary (138).
2008-06-21 Соратники, выпуск 2
Поиск в сети показал, что соратников не так уж и мало, как показалось на первый
взгляд, пришлось даже составить отдельный
список, и существуют сайты, вполне подходящие для использования при
переводе с русского на японский. Найди я эти сайты раньше, так, может быть, и
не было бы никакого RJ ;)
Общие тенденции: почти все словари дают японско-русское
направление, и используют обратный поиск русских слов
(поиск слов внутри словарных статей).
2008-06-20 Соратники ;)
Порыскав в сети, я отыскал несколько сайтов, на которых можно искать
японские переводы русских слов, но они по большей части являются
японско-русскими словарями с обратным поиском:
-
WWWJDIC,
сайт Джима Брина, содержит в себе
JR-EDICT под кодом j-russian, и умеет искать словарные статьи по русским
переводам.
- yakusite.ru предлагает
оригинальный японско-русский словарь, по их утверждениям на 4600 слов, но
почему-то всего с ~2900 статьями в индексе. Обратный
поиск статей по русскому переводу работает неплохо (если принять гипотезу, что
работу обратного поиска в принципе можно назвать неплохой). Хорошая новость
состоит в том, что они предлагают пользоваться словарными данными всем желающим
без каких-либо условий, поэтому я добавлю и этот словарь, как только разберусь,
как "развернуть" японско-русский словарь в обратную сторону.
- yakusu.ru. Словарь выглядит довольно развесистым
(~43000 слов), но русско-японское направление в нем тоже реализовано в виде обратного
поиска. Похоже, что весь словарь был собран добровольцами.
2008-06-20 Обновления
Добавил несколько слов, вытащенных из логов посетителей (всего слов: 971). В перспективе мечтаю
собирать эту информацию непосредственно в базе данных, не прибегая к столь
изощренным методам, как просмотр логов веб-сервера.
Исправил баг с кодировкой, почему-то с некоторых клиентов запросы приходят в форме строки \xd0\xb5... вместо положенного URL-encode %D0%B5...
2008-06-19
Первые сложности с установкой Ruby on Rails преодолены, и поиск
заработал (вчера поздно вечером). К несчастью, заработал он в "нештатном"
режиме, и вместо нормального RoR сервера работает через CGI-скрипт, то есть на
каждый запрос запускается новый процесс, который заново загружает
все словари и т.п. Приводит это к тому, что время обработки одного запроса
составлят около 2 секунд, вместо положенных 0.03–0.1.
Демонстрацией возможностей морфологического анализа объявляется слово «раздела».
Вечером того же дня появились первые посетители (после анонса в “ロシア語マニア”). Слов — 950.
2008-06-18
Словарь нашел пристанище в сети.
Спасибо хостингу vlexo.com.
Тем временем в словаре уже набралось около 900 слов.
2008-06-13
Программа научилась склонять первое существительное: «привет».
2008-06-12 День рождения RJ!
Первые четыре слова: «и», «в», «утрата», и «играть» добавлены в словарь.
2008-06-10
Первые часы потрачены на обдумывание того, как бы поудобнее запрограммировать
особенности морфологии русского языка, с конечной целью включить
распознавание несловарных форм в словарь.
2008-**-**
А началось все с того, что однажды мы с моей подругой отправились в магазин
с намерением приобрести русско-японский словарь. Один оказался приличным, но
слишком большим по размерам, а второй подошел по размеру, но совершенно не
понравился мне по содержанию. Если полсловаря состоит из объяснений русского
жаргона, то как вы думаете, как будет звучать речь человека, изучавшего русский
язык по такому словарю? No, thank you, как говорит А. И я подумал, а не
собрать ли мне свой словарик, по своему вкусу. Последней каплей стала
попытка найти существующий русско-японский онлайн-словарь. Один нашелся,
но вместо перевода слов выдавал полную чушь. Поэтому, похоже, что место еще
не занято, и этот скромный словарь еще может кому-нибудь помочь.