© 2019 一般社団法人化学情報協会
AI 翻訳(NMT)の最新動向と
機械翻訳サービスへの適用
2019/11/7 2019 特許・情報フェア&コンファレンス
アジェンダ
1 JAICI の機械翻訳サービス ご紹介 JAICI
2 翻訳バンクとアダプテーションによる NMT 超高精度化 NICT 内山様
3 個別カスタマイズのご紹介
~ 知財業務を翻訳でトータルサポート JAICI
NICT: 国立研究開発法人 情報通信研究機構
2
化学情報協会について
法人名 一般社団法人化学情報協会
Japan Association for International Chemical Information
所在地 東京都文京区
設立 1971年 (2011年4月 一般社団法人へ移行)
ミッション 化学情報を通して日本の,そして世界の科学技術の発展に貢献する
URL https://www.jaici.or.jp/
化合物名,機械翻訳,専門用語辞書
3
JAICI AutoTrans とは
2018/1 サービス提供開始(英日特許) 2018/4 中日特許対応(簡体字) 2018/7 中日特許対応(繁体字) 2019/6 英日文献対応 2019/11 韓日特許,中日文献対応予定
化学はおまかせ!
特許・文献に最適な機械翻訳サービス
NICT* 翻訳エンジン利用
(*国立研究開発法人 情報通信研究機構)
4 特許・科学技術文献に強い! 特長5点
1. 特許・文献を読みやすい訳文に 特許,文献を学習した NICT NMT* 翻訳エンジンを選択 今後 NICT NMT 翻訳エンジンは更に進化 * NMT = ニューラル機械翻訳
2. 化合物名称を適切に翻訳 他のサービスにはない特長
5 化合物名称を適切に翻訳
(*) 書籍「特許実務者・研究開発者のためのAI機械翻訳の最前線」(日本特許翻訳株式会社・化学情報協会など, 2018/11)
https://www.jaici.or.jp/news/news.php?selectedId=1948
原文 乳糖醇 五(二乙基氨基)钽
Web 翻訳 乳糖アルコール ビス (ジエチルアミノ) タンタル
JAICI ラクチトール ペンタ(ジエチルアミノ) タンタル
ある特許明細書群に含まれる化合物表記翻訳の「誤訳率」比較結果(*)
誤訳率の低い化合物 名称を提供
JAICI 独自技術
・数値や記号の 訳抜け,翻訳崩れに対応 ・定期的に更新
数値 (ロカント) や記号の混在 翻訳エンジンは化合物表記翻訳が苦手 特に,中日は顕著
6 特許・科学技術文献に強い! 特長5点
3. 訳漏れ・誤訳などを大幅軽減
長文,箇条書きの構文崩れや数値抜けを防ぐ原文の前編集* *日本特許翻訳株式会社様の保有技術
4. 用途に合わせた多彩なメニュー 特許全文,Excel / Word / PDF / PowerPoint ファイルに対応
5. セキュアな環境 SSL 対応,専用データセンターで運用
7 JAICI AutoTrans の利用場面
こんなニーズにお応えします 各種データベース検索結果のスクリーニングを効率化したい 外国特許を効率よく読みたい 文献をまとめて和訳で把握したい 外国語資料の和訳を簡便に作成したい
8
Excelファイルに和訳挿入 各種データベース検索結果のスクリーニングを効率化したい
• 原文と訳文を比較しながら確認
• 請求項を項目に分割して翻訳することも可能
対象データに合わせた
3つのメニューで使い分け
- 汎用ワークシート翻訳 - ファイル翻訳 - 汎用ワークシート翻訳 1000
訳文挿入 訳文挿入
9
PatSpread 翻訳 外国特許を効率よく読みたい
~特許全文の原文と訳文を同一レイアウトで提供~
• 原文と訳文が見比べやすい • 中国特許の8割以上が自国出願のみ.中国語原文を和訳で読める • 特許番号のみの簡単発注 → 研究者などのエンドユーザーに好評
特許番号
原文 訳文
発注
10
DocSpread 翻訳 文献をまとめて和訳で把握・外国語資料の和訳を簡便に作成したい
~論文・技術文書の翻訳に最適~
翻訳 発注 納品ファイル
ファイルアップロード 原文と同一レイアウト
• PatSpread 翻訳の使いやすさを文献にも適用
• PDF / DOCX / PPTX ファイルを同一レイアウトで翻訳
11
トライアル・デモ翻訳
■無料トライアル ・全メニューをご自身でお試しいただけます
■デモ翻訳 ・お手元の文献や特許を JAICI が代行発注し,翻訳結果をお返しします.
お問い合わせ 化学情報協会 JAICI AutoTrans 担当
https://www.jaici.or.jp/autotrans/
03-5978-3606
アジェンダ
1 JAICI の機械翻訳サービス ご紹介 JAICI
2 翻訳バンクとアダプテーションによる NMT 超高精度化 NICT 内山様
3 個別カスタマイズのご紹介
~ 知財業務を翻訳でトータルサポート JAICI
NICT: 国立研究開発法人 情報通信研究機構
アジェンダ
1 JAICI の機械翻訳サービス ご紹介 JAICI
2 翻訳バンクとアダプテーションによる NMT 超高精度化 NICT 内山様
3 個別カスタマイズのご紹介
~ 知財業務を翻訳でトータルサポート JAICI
NICT: 国立研究開発法人 情報通信研究機構
14
翻訳を読む
知財業務×翻訳
原文の概要を把握
・特許調査
・スクリーニング
翻訳を仕上げる
最終的な翻訳文書作成
・出願用などの定型文書
別ニーズの顕在化
15
知財業務×翻訳:現状
他商用 DB
- 要望
- 翻訳文書を図面を含め仕上げたい.レイアウトを保持したい
- 「テキスト部分を翻訳,後で図面を挿入」など手動作業を低減したい
- 最低限の校正で仕上げられる翻訳品質
仕上げ 翻訳 原文
16
機械翻訳
機械翻訳で業務フロー転換
仕上げ 原文
- 翻訳エンジン性能が向上 → 機械翻訳を下訳に使える時代に!
- 「人手翻訳 → 機械翻訳+仕上げ」業務フローの転換
17
個別カスタマイズ
個別カスタマイズ
貴社専用 エンジン
貴社保有文書
貴社 統一用語集
文献向け エンジン
特許向け エンジン
追加学習
- 過去に蓄積した文章表現,社内統一用語を学習
- 追加学習 ≒ アダプテーション + 辞書登録
NICT NMT 翻訳エンジン
18
業務フローの刷新へ
機械翻訳 人手後編集
レイアウトそのまま翻訳
PDF,DOCX ファイルに対応
業界標準ツール Trados
などで翻訳仕上げ
- 対訳データ・機械翻訳データを下訳に → 翻訳品質の安定化
- 定型的な文書を,個別カスタマイズしたエンジンで翻訳
- 翻訳文書作成,全工程の時間短縮・費用削減へ
翻訳したい 文書
貴社専用 エンジン
19
活用例:特許出願業務
20
活用例:製薬企業
21
翻訳を読む
知財業務を翻訳でトータルサポート
原文の概要を把握
・特許調査
・スクリーニング
翻訳を仕上げる
最終的な翻訳文書作成
・出願用などの定型文書
個別カスタマイズ
JAICI 化合物表記翻訳