過去、日本語版の浄化槽と英語版のseptic tankのあいだに言語間リンクがありました。しかし、septic tankは専門的には腐敗槽と訳されており、下水設備ではありますが、浄化槽とは構造も使用されてきた歴史もまったく異なるもので不適切なリンクでした。
他言語版のウィキペディアからの翻訳は言語間リンクが手がかりになっていると思いますが、専門的な術語を翻訳する際には言語間リンクが正確で適正なものか可能な限り事前確認を行っていただきたいです。--Mbbcari(会話) 2019年7月17日 (水) 20:38 (UTC)
Wikipedia:翻訳のガイドライン#機械翻訳の著作権節において、以下のように翻訳結果の利用可否が提示されていますが、これは現在も有効なものでしょうか?
以下は翻訳結果をGFDLに準拠して利用できると確認できたソフトウェアです。
* 東芝ソリューション製「The翻訳」シリーズ
* ソースネクスト製「本格翻訳」シリーズ
* ロゴヴィスタ製「コリャ英和シリーズ、ロゴヴィスタ」 シリーズ
以下は翻訳結果をウィキペディアで利用できないと判明しているソフトです。これらのソフトはウィキペディアの記事翻訳に直接は使用はせず、翻訳の参考とする程度に留めてください。
* 富士通 ATLASシリーズ
* インターネット上の機械翻訳(Google翻訳[1]など)
というのも、翻訳ソフトウェアの利用可否は燈馬想氏が調査した結果を元にWikipedia:FAQ 翻訳の2005年4月7日 (木) 12:48 (UTC)版に記述されたものです(関連:Wikipedia:井戸端_(告知)/過去ログ/2005年4月#英日機械翻訳の可能性が開かれました)。しかし、これらは対象のパッケージやバージョンが明確にされておらず、約15年前の調査結果が現在も有効であるかについて疑問があります。当時の日本語版にはWikipedia:独自研究は載せない方針が存在していなかったこともあるのでしょうが、個人的な問い合わせで得られた結果というのは検証可能性の点でも問題があります。
一方、インターネット上の機械翻訳の例として挙げられているGoogle翻訳の直接利用については、2012年の利用規約の改定によって問題がなくなったことが井戸端の議論で確認されています(関連:Wikipedia:井戸端/subj/翻訳ツール(ベータ)を用いた編集の増加と、機械翻訳の取り扱い)。このとき、根拠としてオープンソース コンポーネントとライセンスを挙げるのは間違いであるという解釈も示されています。過去に一度ノートにて行われた「機械翻訳」についての調査と修正の提案と修正の提案の再論となりますが、この記述は除去するべきではないでしょうか。
念の為に申し上げますが、ここで問題としているのは機械翻訳の質ではなく、機械翻訳のライセンスについてです。前述の井戸端の議論でGoogle翻訳の利用がケースB-1に該当しないことが確認された後も、Google翻訳の利用を理由にケースB-1で削除されることが度々発生しており[2][3]、本ガイドラインの記述が原因であると推測されます。削除の判断基準とするため翻訳結果の利用可否一覧が必要とされるのも分かりますが、著作権に関わる法的事項について予断する記述は非常に危険であり、慎重に行われるべきと考えます。--ProxyMon(会話) 2020年1月2日 (木) 12:42 (UTC)
- まず「The翻訳」は販売が終了しております。こちらは歴史的なソフトウェアとして別枠が必要でしょう。各ソフトのライセンスについて記載されていないため、それぞれのソフトウェアをお持ちでなければこのリストの更新はできませんが、15年前の調査結果をもって「B-1に該当しない/する」との判断を維持するよりは、再調査が望ましいです。
- Google翻訳についてはProxyMonさんの参照された議論は、最終的にオープンソース コンポーネントとライセンスにある日本語版のライセンス(日本語 Wordnet)を解決する合意が得られませんでした。この議論は「ライセンスの範囲を決めつけた」という欠陥があり、「翻訳結果を対象外とする明文の規定がない」という点で合意が得られなかったのです(合意形成が必要なので最終発言者が賛成側であったことは理由になりません)。このライセンス形態は現在でも変わっていないばかりか、「コンテンツ翻訳でGoogle翻訳を利用するために1年更新での合意を行った」ことで疑惑がさらに強固になりました。とはいっても、コンテンツ翻訳が使える=記事の翻訳なら使えるなので、実質的にGoogle翻訳が問題になるのは「(翻訳元記事がコピペの場合を含む)外部の翻訳コピペ」に限定されます(ほとんどは機械翻訳の著作権とは無関係に削除されます)。そしてこのケースがあるためにGoogle翻訳を単純に外すことはできません。
- ProxyMonさんが例示されたようなケースは、「心が鳴る」はProxyMonさんの懸念が的中しており、「海の掃除機」は対象外となります。以下は正常に処理を行った場合になります。
- 「心が鳴る」の場合「翻訳のガイドラインの機械翻訳には該当するが、コンテンツ翻訳の例外に該当しB-1ではない」となります。結果「機械翻訳としてのケースBは存続」です。ただし、別の問題(品質によるケースG、履歴によるケースB)があるので、履歴を補って改稿されない限り削除されます。
- 「海の掃除機」は、外部からの翻訳のため「コンテンツ翻訳の例外」に該当せずB-1がそのまま適用され削除(版指定)されます。ただし、CC-BY-SAを満たせないという別の問題があるため、「利用可能な機械翻訳」を用いても削除(版指定)されます。
- この利用できるケースと利用できないケースの衝突は機械翻訳の著作権節に「コンテンツ翻訳で提供されている範囲においては使用可能である機械翻訳」という別グループを作れば回避できます。以下応急処置の文案です。
「以下は[[#コンテンツ翻訳]]で提供されている範囲においては使用可能である機械翻訳です。他言語版記事以外を翻訳した場合は「利用できない」ソフトウェアとして扱われます。」
* インターネット上の機械翻訳(Google翻訳[4]など、「ヤンデックス翻訳、有道(Youdao)翻訳、LingoCloud」)
以下は翻訳結果をウィキペディアで利用できないと判明しているソフトです。これらのソフトはウィキペディアの記事翻訳に直接は使用はせず、翻訳の参考とする程度に留めてください。
* インターネット上の機械翻訳(「excite翻訳[5]」Google翻訳[6]など)
「以下は2005年の調査に基づく記載です。最新の状況への更新が望まれています。」
以下は翻訳結果をGFDLに準拠して利用できると「2005年の調査で確認された」確認できたソフトウェアです。
* 東芝ソリューション製「The翻訳」シリーズ「(2005年確認、2019年販売中止)」
* ソースネクスト製「本格翻訳」シリーズ「(2005年確認)」
* ロゴヴィスタ製「コリャ英和シリーズ、ロゴヴィスタ」 シリーズ「(2005年確認)」
以下は翻訳結果をウィキペディアで利用できないと「2005年の調査で確認された」判明しているソフト「ウェア」です。これらのソフト「ウェア」はウィキペディアの記事翻訳に直接は使用はせず、翻訳の参考とする程度に留めてください。
* 富士通 ATLASシリーズ「(2005年確認)」
「ここにあげられていないものは翻訳結果をウィキペディアで利用できると判明していない調査中のソフトウェアとなります。利用できると確認されるまでは、利用できないソフトウェアとして扱われます。未確認のソフトウェアはウィキペディアの記事翻訳に直接は使用はせず、翻訳の参考とする程度に留めてください。また、調査を行った方はノートにてお知らせ下さい。」
- 「」が追加、打ち消し線が除去となります。大きな変化としては、コンテンツ翻訳が独立したグループになること、リスト外の扱いの明記、調査年を明記しての再調査の呼びかけです。
- まず確認済みのソフトウェア4種に確認年を追加、再調査を求めます。「The翻訳」は
発売販売中止のため、その旨を加えます。これは調査がある程度でそろった際に歴史節を設けるための準備です。次いで、コンテンツ翻訳による例外を加えます。これは「心が鳴る」で発生したような誤認削除を避けるためです。次いで、excite翻訳は明文で使用できないことが判明しているためこれを「利用できない」例としてGoogle翻訳と差し替えます。最後に調査への協力を求め、未判明のものに対する処置(現在削除対象)について明文化し調査協力を求めます。最後にソフトとソフトウェアの共存を解消します。
- 恐らくこの改訂で多くの機械翻訳はケースBによる誤認削除を回避できるはずです。再調査は時間が掛かるので、まず誤認削除を防ぐことを優先したいと考えます。--Open-box(会話) 2020年1月2日 (木) 17:59 (UTC)--誤字訂正、コンテンツ翻訳を列挙に変更--Open-box(会話) 2020年1月2日 (木) 18:20 (UTC)--誤記入の訂正--Open-box(会話) 2020年1月2日 (木) 18:29 (UTC)
- 表記調整を行った上で適用してあります。--Open-box(会話) 2020年1月14日 (火) 12:00 (UTC)
- 議論への参加と応急処置に感謝致します。富士通ATLASシリーズについては下記の一次回答が得られました。
お客様
お問い合わせありがとうございます。
富士通ATLASサポートセンターでございます。
お問い合わせの件につきまして、回答いたします。
■商用利用について
有償、無償を問わず、ソフトウェア(ATLAS製品)を使用してサービスを提供する
ことはできません。
なお、製品に同梱されております「使用権許諾書」の「使用条件C」に
以下の記載がございます。合わせてご確認をお願いいたします。
・お客様は、有償・無償を問わず第三者に対して本ソフトウェアを使用してサー
ビスを提供することはできないものとします。
以上、ご確認のほど、よろしくお願いいたします。
ご不明な点がございましたら、またご利用ください。
今後とも弊社製品をよろしくお願いいたします。
- しかしながら、これはATLASを利用して他人の需要に応じる翻訳を禁止するもので、自発的な意思に基づくWikipediaへの投稿とは状況が異なるのではないかと思われる部分もあり、再度問い合わせ中です。結果が得られましたら再度報告させていただきます。--ProxyMon(会話) 2020年1月20日 (月) 21:38 (UTC)
いくつか更新を行いました。
- MatxinからEliaへの変更。
- 未判明・不可の確認が取れたものの反映。みらいとWeblioが不可と確認できました。未確認の例として利用ケースが多いBing、DeepL、バビロン、百度を追加しています。
この他Papagoは遵守事項で他者の文章の利用不可は確認できますが、その他について未確認です。--Open-box(会話) 2021年8月24日 (火) 18:24 (UTC)
- DeepLに関して、DeepL Pro版ではDeepL Pro – Terms and Conditions(2021年9月18日閲覧)の「7. Copyright and Intellectual Property」の7.5にて、翻訳結果については著作権を主張せず、著作権法で保護されるとみなされる場合でも、変更や派生物の作成も含めて移転可能・サブライセンス可能な権利を付与するといった内容になっています。利用可能な機械翻訳ソフトウェアに追加できるでしょうか。--Takahashimm(会話) 2021年9月18日 (土) 08:41 (UTC)
- 問題は無償版はむしろ不可と読めるのにDeepL Translator (free) – Terms and conditions、Proと大多数が使用する通常版の区別ができない(これはBabylon翻訳オンライン版とダウンロード版にも共通の問題)ところにあります。Babylonは不可と言及無しなので対処が容易、他の有償タイプはオンラインがないので区別の必要が無いのですが。将来的に同様のライセンス形態は出てくるでしょうし対策は必要ですが、善意を信用できないほど乱用されているので難しいです。Proを認めた場合、必ず「自分はPro版の利用者です」と言い逃れるでしょう。ここの区別を行う方法があれば対応可能と思われます。なおDeepLの無償版は一見それっぽい回答を返すため盲信する利用者が多いのですが、省略がひどい(文単位をやらかす)ので、正直なところあまり信用できないなとは思います。--Open-box(会話) 2021年9月21日 (火) 12:38 (UTC)
- みんなの自動翻訳が「利用可能」として追加されていましたが、残念ながら利用規約2条2項に「非商用利用に限定」とありましたので「利用不可」と確認できました。こちらは利用不可に移動しました。
- DeepL Proは先の区別問題が解決できず、DeepLはWikipedia:削除依頼/イギリスの共和主義以降利用不可で固まりつつあります。--Open-box(会話) 2022年1月28日 (金) 13:56 (UTC)
「みんなの翻訳」は、利用規定の別紙1第1項に基づき、利用可能と判断できるのではないでしょうか?--Jutha DDA(会話) 2022年1月28日 (金) 14:33 (UTC)
「別紙1第1項」の「当該文書」はこの場合Wikipediaを指しますので、「利用者や目的の制限なく一般に無償公開する場合」となり「当該文書のライセンスが当該文書の利用の目的や範囲等を限定していない場合であっても、これによらず利用できます」ですから確かに本来は公開できますが……仕様上転載経由と利用者ページ経由で使えてしまうのと、CCではない文書にも使えてしまうので(要は外部資料翻訳には使えない)、そこの穴を塞ぐ必要があります。これは「外部の転載ではないWikipediaの翻訳に限り」と限定付ければ対応できそうなんですが……。つまり外部からの機械翻訳を認めるのがまずいので、Wikipediaをロンダリングに使わせない限定付きになりますね。完全に新しい分類になるので、
- 『コンテンツ翻訳に組み込まれていないが(外部の転載ではない)本文の翻訳には使用できる機械翻訳』
- を追加しましょうか。従来にはない分類になりますので、これで意味が通るといいのですが、ひねりすぎでしょうか?--Open-box(会話) 2022年1月28日 (金) 15:38 (UTC)
- 先行して、本文には使える旨を追記しておきました。--Open-box(会話) 2022年1月28日 (金) 15:48 (UTC)
「本文」という限定の仕方だと、たとえば他言語版やほかのプロジェクトのプロジェクト名前空間(Wikipedia名前空間など)や会話ページはライセンス上問題がなくても翻訳元にできないようなニュアンスになるので、ちょっとどうかなと思います。というのは、使ってみたかんじそれなりに精度が高く(記事の翻訳に使うには、問題が散見されますが)こなれた訳文が出力されるので、たとえばWikipedia‐ノート名前空間などでの議論における他言語版やメタなどの方針や先行議論の紹介、あるいはテンプレート移入時のドキュメンテーションの翻訳という使い方ができれば、結構有用なのではないかと考えられるからです。--Jutha DDA(会話) 2022年1月30日 (日) 18:57 (UTC)
- 経験則的に有害な記載が発生するのは、「利用者ページ」「標準」「(引用で結果的に発生する)ノートやWikipedia空間」ですね。絶対的に外すべきは「利用者ページ」(自由に作れるので仕込んで訳して削除という手が使えるだけではなく、たたき台・メモ的な転載含みの下書きが要警戒)とこれに準ずる「Draft」、外したいが外すと意味がないのが「標準」(転載多い)、いざとなればそこだけ外して削除依頼が使えるのが「ノートやWikipedia空間」。「転載・利用者ページ・Draft・Wikipedia外部の文書(引用部やCC以外の対策)」この4点セットを外せばなんとか運用可能でしょうか。他の無料機械翻訳より使用環境が緩いので、狙って開けてくる穴だけでも塞いでおくべきですから。--Open-box(会話) 2022年2月1日 (火) 14:40 (UTC)
報告 みんなの自動翻訳について、翻訳結果のオープンソースライセンスの付与や著作権者に関する質問と回答がみんなの自動翻訳の質問・要望詳細のID:371「オープンソースライセンスでライセンスされた文書に対する「みんなの機械翻訳」の翻訳結果に対して、オープンソースライセンスを付与することは可能でしょうか?またその場合の著作権者は誰になるでしょうか?」というページにありました。このページが見れない方がいらっしゃるかもしれませんので、転記しておきます。
ID: 371 解決済み BlueSkyDetector 2021-02-12 17:17:21
オープンソースライセンスでライセンスされた文書に対する「みんなの機械翻訳」の翻訳結果に対して、オープンソースライセンスを付与することは可能でしょうか?またその場合の著作権者は誰になるでしょうか?
利用規約に以下文言があることは確認しています。
「アプリケーション利用者は、商用目的や公序良俗に反する目的のためにアプリケーションを利用することはできません。ただし、アプリケーションを利用して、Wikipedia等のCreative Commons License の文書や、 GNU General Public License, MIT License, Apache License, BSD License 等のオープンソースソフトウェアの文書等の公益性が高い文書であって、アプリケーション利用者がその文書の自動翻訳結果や修正結果を利用者や目的の制限なく一般に無償公開する場合には、当該文書のライセンスが当該文書の利用の目的や範囲等を限定していない場合であっても、これによらず利用できます。」
ただ、「利用できます」というのは分かりますが、利用して翻訳結果を出すことができるまでなのか、それとも翻訳結果に対してオープンソースライセンスを付与することまでできるのか分かりませんでした。
また、もしオープンソースライセンスを付与することができるとした場合、著作権者がだれになるか(つまり著作権が譲渡されるのかされないのか)についても確認したいです。
No. 1 Masao Utiyama @ NICT 2021-02-12 20:43:41
利用規約からすると、OSS文書の自動翻訳結果やその修正結果を、元文書と同一のOSSライセンスでリリースすることは、何ら問題ないと思います。一方、著作権者が誰になるかについては、担当部署に聞いてみますので、少しお待ちください。
No. 2 Masao Utiyama @ NICT 2021-02-16 12:02:41
NICTの内山です。次ようにしていただければと思います。
ーーー
OSSの文書を翻訳したものを配布する場合には、OSSの条件に従ってください。OSSにはいろいろなものがありますが、元の文書の著作権表示は必要だと思います。
「みんなの自動翻訳」を利用して、OSSの文書を翻訳する時には、出力された結果を確認し、修正・変更など手を入れられると思います。そのようにした場合には、原文・翻訳文の著作権については、「みんなの自動翻訳」を電子辞書のように利用したと同じと考えられますので、通常の人手による翻訳と同様の著作権となります。
OSSの条件や「通常の人手による翻訳と同様の著作権」については、当方による回答の範囲を超えますので、どこか適切なソースをご参照ください。
ーーー
既知の情報であるかもしれませんが、ご報告いたしました。--冷床系(会話) 2022年4月2日 (土) 00:34 (UTC)
翻訳のガイドライン#機械翻訳の著作権に「以下は翻訳のガイドライン#コンテンツ翻訳で提供されている範囲においては使用可能である機械翻訳です。他言語版記事以外を翻訳した場合は「利用できない」ソフトウェアとして扱われます。」という文章があります。この文章だとコンテンツ翻訳以外で他言語版記事を翻訳する際に機械翻訳を「利用できる」のか「利用できない」のかがはっきりしません。どちらなのでしょうか。--HaussmannSaintLazare(会話) 2020年5月20日 (水) 18:03 (UTC)
Wikipedia:翻訳のガイドライン#要約欄への記入節において、翻訳元の版指定をタイムスタンプで行う場合には「タイムゾーン」も指定することなっています。下部の図の3つ目、5つ目がタイムスタンプを取得するための説明図で、「年月日・時刻・タイムゾーンが表示されています」とありますが、ここにはタイムゾーンが表示されていません。タイムゾーンは各言語版の記事を表示する際に個別に設定できるようになっていて、フランス語版やドイツ語版でもUTCやその他に設定できます。翻訳しようとしている記事の履歴においては日時は容易に分かりますが、タイムゾーンについては自分の閲覧環境に依存し、確認に一手間かかります。それらに関する注意点は、一部言語版のタイムゾーンがUTCと異なる旨があることを除き記載されていません。
さらに(これはまだ確認していませんが)翻訳した編集者以外がそのタイムスタンプ・タイムゾーンの元記事を閲覧しようとした場合、各言語版におけるタイムゾーンの設定が編集者と閲覧者で異なっていると、どの版であるかが分からなくなるおそれがあるのではないか、という懸念があります。
私の認識が間違っているのであれば良いのですが、そうでなければ何らかの補足説明が必要だと思います。その場合少なくとも、
- タイムゾーンの確認方法の追記する
- 版指定の「タイムスタンプ・タイムゾーン」方式は優先順位を下げる
とした方がよいと考えますがいかがでしょうか。(版のidを指定する方法であれば、このような混乱がなくていいのではないかと思いますが)
--みそがい(会話) 2020年11月14日 (土) 01:31 (UTC)
フルバージョンももちろん必要だが、初心者向けからは遠い。プロジェクト:翻訳のほうを初心者向けミニマム版にして相互にリンクするのが作業量が少なくすむと思う。ただ私はビジュアルエディタほとんど使ったことないのでそこはヘルプ書く上で不安。ご意見を待つ--219.97.78.127 2021年2月2日 (火) 07:36 (UTC)
「初心者」であればなおのこと、留意しなければならない諸々の点を知っておく必要があるでしょう。私から見ると、いろいろ気をつけなければいけないことを知らない方が軽々に「翻訳」しないでほしいと思います。
- 方針文書やガイドライン文書を変更する場合には、広い告知と大きな合意が求められます。IPさんにとっては「最小限」と思われても、他の利用者からみれば違います。そこに合意プロセスが必要です。
- 参照先であるプロジェクト:翻訳の文書自体をIPさんが独断で書き換えていますから、実質的にIPさんが独断でガイドラインを変更するのに等しいです。
- 会話ページにもお知らせしましたとおり、Wikipedia:説明責任を参照してください。説明責任を果たしていないIP利用者が、いきなり独断でガイドライン文書を改変するというのは異質です。「あなたが「雑草とり」と呼ばれるメンテナンス的な編集のみで参加しようと思っているなら別ですが」重要な文書の変更について議論したいのであれば、まずは「アカウントを取得し、ログインして説明責任が果たせる立場になった上で」にしてください。「ログインしていないのは、自身の投稿に自信がなかったり、責任を持ちたくないためであるとか、ウィキペディアの方針に沿っていないことを自覚しているため、と見られることも多々あります。」
- Wikipedia:腕ずくで解決しようとしないも参照してください。あなたの編集に異議があって差し戻されたわけですから、合意前に編集強行するのはおやめください。--柒月例祭(会話) 2021年2月2日 (火) 09:22 (UTC)
返信 基本的には他利用者の意見を待ちたいと思います。
- アカウントの取得には様々な意味があり、「対話窓口の一本化」はその一つです。それと同じぐらい重要なのが「説明責任」すなわち自己の投稿履歴をオープンにするというものです。IPさんはそれに応えていません。「恨みを買う」というのは一方的な主張で、確かにそういうこともあるでしょうけど、IPさんの側が間違っているという可能性もあります。「ログインしていないのは、自身の投稿に自信がなかったり、責任を持ちたくないためであるとか、ウィキペディアの方針に沿っていないことを自覚しているため、と見られることも多々あります。」
- IPさんが設けた誘導先はIPさんが独断で書き換えた文書であり、広いコンセンサスを得たものではありません。文書の効力で言えばガイドラインのほうがずっと上です。IPさんの私論を真に受けた利用者があとで「間違っている」と言われることもあります。
- 「翻訳作業に入る前に、知っておかねばならない様々な注意点がある」ことを、このガイドラインを説明しています。それに比べると、IPさんの私論には、「翻訳作業」の部分しか説明していません。重要な事柄の説明が欠落しています。「ウィキペディアで初めて翻訳をする人」が相手の場合には、なおさらです。
- 私だったら、「翻訳する時に不可欠なのは、英和辞書ではなく、そのテーマの専門書だ」ということを強調しておきたいですね。「翻訳の前に、そのテーマに関する専門書を2、3冊は読んでおくように」と言いたい。特に「ウィキペディアで初めて翻訳をする人」が相手の場合には。--柒月例祭(会話) 2021年2月5日 (金) 05:47 (UTC)
返信 翻訳レベルの底上げを図るという意味で、発想自体は悪くないかなと思います。柒月例祭さんの仰ることも分かるんですが、その辺はWikipedia:翻訳のガイドラインへの誘導の仕方次第である程度解消できるんじゃないでしょうか。
提案 一案として、(新規執筆・加筆・翻訳それぞれについて)物語形式(「〇〇大学に通うAさんは、ウィキペディアに□□という記事がないので自分で作ってみようと考えました。~」みたいなの)とか対話篇形式とかで、なぜ検証可能性を満たすべきなのか、なんでこういう記事は翻訳するべきではないのかといった実例も交えた形にすれば、「これは入門編なんだ」ってことが分かりやすくて、ガイドラインとの住み分けもうまくできるんじゃないかな、っていうのを思いついんたですが、どうでしょう?--Jutha DDA(会話) 2021年2月10日 (水) 23:54 (UTC)
- どうでしょうねえ。
- 私論として作成するなら、各々が思うところを書けばいいと思います。ただガイドラインとかHelp文書のような位置づけにするのはどうかなあ。たとえばなんですけど、日本翻訳協会みたいなところで資格や経験を積んだ「翻訳のベテラン」が、Wikipedia特有の作法を知るためのページなのか。Wikipediaの作法を熟知した人向けか。それとも、そのどちらも未経験ですみたいな人が相手なのか。
- まずWikipediaのルールを知った上で、日本語の文献をしっかり調べて記事を作る。それには当然、Wikipediaの諸文書を読むだけでなく、複数の情報源を注意深く読み比べるようなことも求められる。それをある程度マスターしてWikipediaの編集の基本がわかったら、次は翻訳に、というのが正道だと、私は思っています。
- 一方で、「長い文書も読みたくない、めんどうなことはしたくない、初心者だけどサクッと翻訳したい」という人もいて、調べ物もせずに機械翻訳にぶちこんで済ませる人もいる。
- 世の中の翻訳書は、多くの場合、その分野のことをよく知っている人が翻訳にあたっています。分野ごとの注意点もあるでしょう。所詮は私論に過ぎませんが、「鉱物の記事を翻訳するのは、日本語の鉱物記事執筆LVがカンストしてから」と言いたいですね。。。--柒月例祭(会話) 2021年2月11日 (木) 00:50 (UTC)
私はちょうど2ヶ月ぐらい前から本格的に編集をはじめて、最初の1ヶ月ぐらいで方針・ガイドライン・Helpとおもだった私論にはだいたい目を通しました。でも(多少なりとも編集に携わる)利用者の多くは、そういう「だいたい目を通す」タイプではなく、「めんどうなことはしたくない」タイプなんじゃないかなと思います。ところが現状、初心者に「とりあえずこれは読んでね」と伝える文章はWikipedia:ガイドブックとかWikipedia:五本の柱あたりになると思うんですが、これって結局のところ「これとこれとこれとこれと……は読んどいてね」という目録でしかなくって、「だいたい目を通す」タイプの人向けの入り口としては適切であっても、「めんどうなことはしたくない」タイプの人向けではありません(Wikipedia:児童・生徒の方々へもありますが、これはこれで使える場合が限定されてきます)。
おそらく、こういう場で議論に参加して最終的な合意形成まで至るさいには、「だいたい目を通す」タイプの人の意見の比重がどうしても大きくなってしまうので、もう少し「めんどうなことはしたくない」タイプの人の立場も考えないと、いつまで経っても日本語版ウィキペディアの全体としてのレベルが上がらないんじゃないんだろうか、というのがいろんな利用者の方を見て抱いた感想です。そしてこの「日本語版ウィキペディアの全体としてのレベル」の底上げという問題にちゃんと取り組もうとするなら、だれか個人の私論という形ではなく、(最終的にはWikipedia名前空間の私論といったあたりに着地してもいいんですが)まずは方針やガイドラインを作るときと同じレベルで、そういう「めんどうなことはしたくない」タイプの方向けの文章(物語形式とか対話篇ってのはあくまでも一案なので別の形式でも全然いいと思います)を整備する必要があるんじゃないか、というのが私の考えです。--Jutha DDA(会話) 2021年2月11日 (木) 01:54 (UTC)
以前、初版に翻訳元の記事は示されているものの版指定が書かれていない翻訳記事に対する削除依頼を見かけたことがあります。削除依頼の中で翻訳元の版が指摘されていました。そのときは気づかなかったのですが、このような場合、削除したうえで再翻訳するまでもなく、「版指定を要約欄に記入すればよいだけ」だというのが確認していただきたいことです。それはWikipedia:翻訳のガイドライン#要約欄への記入忘れ・誤記入にある「翻訳投稿の際、要約欄に翻訳元記事へのリンクは書いたが、版指定を忘れた場合」に版指定を追記すればよいと書かれているからです。私自身その下にある「初版で要約欄への記載忘れまたは誤記入をし、他の利用者による以降の編集がない場合」と混同して、他の編集者が編集した後ではこの方法は使えないと思っていたのですが、「他の利用者による以降の編集がない」という条件は付いていないので、他の利用者による以降の編集があっても誰かが版指定を忘れていることに気付いた時点で追記すればよいということになります。おそらく削除依頼者も私と同じ勘違いをしておられたのだろうと想像しています。以上、確認をお願いします。--27.85.207.229 2021年12月17日 (金) 16:59 (UTC)加筆しました。--27.85.207.229 2021年12月17日 (金) 17:20 (UTC)
「Wikipedia:翻訳のガイドライン#要約欄への記入」に「[[Wikipedia:ウィキペディア内でのコピー#ウィキペディアにおける翻訳|ウィキペディアにおける翻訳]]にあるように、」と「Wikipedia:ウィキペディア内でのコピー#ウィキペディアにおける翻訳」節へのリンクがありますが、当該節は「Wikipedia‐ノート:ウィキペディア内でのコピー#「ウィキペディア内別文書からの複製・改変」セクション廃止提案」での提案に基き特別:差分/43931338にて除去されており、リンク切れとなってしまっています。この点、どなたか修正していただけないでしょうか。 --Kto2038(会話) 2022年3月24日 (木) 10:50 (UTC)
Wikipedia:削除依頼/Wikipedia:井戸端/subj/デスクトップ版外装(スキン)改善バージョンの実装についての結果、DeepLは開放が決まりました。問題は、DeepLの開放に留まらず、「AI著作権」を盾に取ったため、全ての機械翻訳が利用規約を無視して使用可能となることです。もちろん、利用規約優先→なかったら「AI著作権」という折衷案を採ることも出来ますが、DeepLを開放したためにこれも難しくなっています(他の機械翻訳と異なり、有料版に存在する規約が存在しないことが原因のため)。この件についてWikipedia‐ノート:削除の方針#機械翻訳の全面的な開放についてで提案を行ったことをお知らせします。--Open-box(会話) 2022年10月3日 (月) 14:13 (UTC)
編集の要約に「→著作権: 改訂。異論ある場合はノートへ。」と書いておられますが、事前に議論をせずにガイドラインを変更するのは不適切だと考えます。--106.155.9.90 2022年10月15日 (土) 18:17 (UTC)
- 版番90247064と版番91759023の差分: この話だと思いますが、結局異論あるのですか? 異論があるなら提示してください。--Sethemhat(会話) 2022年10月16日 (日) 00:30 (UTC)
私は、ノート:合法化された中絶が犯罪に及ぼす影響#ノートでの検討は続いていますにて、翻訳のガイドラインに沿わない要約の書き方と、正確性の低い雑な翻訳の問題について、ある質問者へ回答文を書きました。この内容の法的解釈の誤り、その他問題点がありましたら、ぜひご指摘・ご教示をお願いしたく、以下に全文を引用します。
返信 CC by-sa 3.0 (Unported)およびGFDLの著作者表記へのリンクがあるのでこの両者ライセンス自体は一応満たされていると見ていいと、私も思います(過去の例ではこの違反で削除されたが……)。しかしながらWMFは利用規約の7. コンテンツの利用許諾において編集者における元の素材の帰属表示のやり方を 『h.あなたが再利用する素材への修正または追加』(翻訳は素材への修正である) にて別途定めており(前2者のライセンスの説明であるので「追加のライセンス」には抵触しない)、この場合、
- (元のテキストおよび追加したテキストについて)あなたはCC BY-SA 3.0またはそれ以降のバージョンの規約(または上記に説明されるとおり、特定のプロジェクトの言語版または機能により特別に必要とされる場合は別のライセンス)のもとで、修正または追加されたコンテンツを使用許諾することに同意します。
- (テキスト以外の媒体について)修正したり、それに追加したりする場合、あなたはその著作物がそれに基づくことで利用できるようになったあらゆるライセンスに従うことに同意します。
- テキストコンテンツとテキスト以外の媒体の両方において、あなたは当初の著作物が修正されたことを明確に示すことに同意します。ウィキでテキストコンテンツを再利用している場合は、取り込んだテキストに変更を行ったことをページ履歴に示せば十分です。配布する各写しまたは修正版については、ライセンスまたはライセンス自体の写しの本文に対するハイパーリンクまたはURLのいずれかと併せて、あなたはその著作物がどのライセンスに基づいて公表されるのか記載する使用許諾に関する通知を含めることに同意します。(下線は Licsak による)
- となります。問題となるのは一番後の同意事項で、「オリジナル」と「自身の書いたもの」とを分けて書くことを求めています(もとの CC by-sa も GFDL もこのことは同じ)。翻訳作業はまさに『原著作物に対する翻案』ですから、どのような加工を行なったか明確にする必要があります。だから翻訳元の固定URLに追加して、『(翻訳元URL)を翻訳。』のように何を実施したのかを履歴に記す必要があります。厳密にはね。
-
- また、Wikipedia‐ノート:削除依頼/IP:2400:4050:9920:BA00:0:0:0:0/64の作成記事#該当記事一覧にリストアップされた記事群は、ページ履歴の要約欄の記述不備の他、『翻訳品質が極めて悪い』という問題もあります。GFDL には著作者人格権についての具体的規定は無く、クリエイティブ・コモンズには『著作者人格権は行使しない』とありますが、翻訳を含むウィキでの編集に関しては『原著作者の言及・表現その他』+『翻訳者の脚色』と捉えないと、翻訳者が原著作に対して、どこをどう改変したかが不明になってしまう大問題が生じます。ですから記事:著作者人格権にあるように『翻案権についてライセンス付与があった場合は、ライセンスの範囲内で同一性保持権は制約を受けると解され』、翻訳作業は正確性が求められるわけです。その上で翻訳者が注釈を設ける場合は「訳注」として、原著書にない注釈と分かるようにするのです。なお、裁判所も『既存の著作物に依拠して創作された著作物が,思想,感情若しくはアイデア,事実若しくは事件など表現それ自体でない部分又は表現上の創作性がない部分において,既存の著作物と同一性を有するにすぎない場合には,翻案には当たらないと解するのが相当である。』と判断しています(江差追分事件 最判平13.6.28 民集55.4.837、判時1754.144)。つまり、既存の著作物に依拠した上で新たな創作がある場合には翻案となり、それが無い場合には複製となるのです[ノート 1]。したがって『正確な翻訳』は複製とみなせる余地があり、翻訳者が手を加えた『翻案』は無いものとして扱われるでしょう。ですから小説等、同一性保持権と翻案権がセットとなったケースでは翻訳者は正確に翻訳する義務が生じます。当然ウィキペディアの記事も同じでしょう。いくら著作者人格権は行使しない、というライセンスでもね。
-
- 蛇足ですが点字訳本も、著作権法第37条にて誰でも公表された著作物を点字により複製することができますが、一字一句点訳ルールに従って「忠実に再現」することを求めています。これも点訳本での翻案はご法度、というわけです。
-
- 翻訳作業の正確性について、例を挙げましょう。英語の原著作の中に、 "christmas holidays" という語句が有った場合、翻訳作業では「クリスマス休暇」と普通では訳出します。ところがクリエイティブ・コモンズ や GFDL においては、翻案とみなした場合、翻訳者の責任で「年末年始休暇」としても良いわけですし、翻訳者の改変だと分かるようにすれば「お盆休み」にしたって良いわけです。しかしながら、純粋な訳文として見た場合、「クリスマス休暇」は妥当な役ですが、「年末年始休暇」は休暇の始期・終期が合わないなど問題がありますし、訳注を付けずに "christmas holidays" を「お盆休み」に訳し下げたら誤訳ですよね。翻訳の質とは誤訳を極力排除し、ちゃんと正しい訳を作る必要があるわけです。第一に訳文の読者が困るわけですから、誤訳の多い、『翻訳品質の低い訳文』は、排除されなければプロジェクト・コミュニティともに害を与えます。
-
- 最後に自動翻訳ソフト/サイトの出力する訳文のライセンスの問題があります。自動翻訳ソフト/サイトの出力の利用ライセンスがクリエイティブ・コモンズ や GFDL と互換性がない場合、その訳文は採用してはいけません。そこで翻訳者は拙い私訳と混ぜ合わせ、結果トンデモ訳文ばかりの訳出記事が出来上がりました。そうして出来上がったのが、Wikipedia‐ノート:削除依頼/IP:2400:4050:9920:BA00:0:0:0:0/64の作成記事#該当記事一覧にある記事なんです。だから翻訳し直しもしくは、版指定削除・記事の削除が求められているわけです。--Licsak(会話) 2022年11月20日 (日) 18:57 (UTC)
|
どんな辛辣な言葉でも結構です。よろしくお願い申し上げます。--Licsak(会話) 2022年11月20日 (日) 19:17 (UTC)
個人的に「失敗した」反省点を書きます。
- 原文の翻訳なのか、訳者による補足か、混同がある。
- 解決法=版を分ける。
これは私もよくやりがちで、顧みるに冷静さよりも深入りが原因です。場面はおそらく2種類あります。(a)原文の内容が込み入っている。(b)機械翻訳のところてん式訳文の改稿。
いずれもエビデンスを示したくなるせいです。
以下、細かいのですが、ご参考まで。私の目指す使用事例です。
没入しすぎて混同する弊を防ぐにはどうするか、この機会に考えました。
- とにかく校正のつもりで文字直しをする。
- 改版して典拠を記入する作業まで、時間が空くかもしれない場合は、必要に応じて「訳語疑問点範囲」「要出典」などテンプレートを貼って周知。どなたかフォローしてくれるかもしれない。
- 校正しながら典拠を調べるから、ウィキの外部の編集ソフトを並行して使う。調べた参考資料の書誌情報などを書き出しておく。後で記事の「参考文献」欄で使う。なるべく引用構文を書いて、ref引数にharvまたはsfnを指定して、脚注に飛べるようにする。
たいへん参考になり、足元を見つめました。電子空間だからこそ意識が欠かせないアプリの利用規約などは神経質になるくせに、根本的な姿勢が見苦しいと反省します。
- 後述部分=参考情報:内規に相当する記述について。
同じウィキメディア傘下の他のウィキから、訳文をウィキペディアその他のウィキ群に持ち込む作法の解説あり(引用元:metawiki・略号:mw)。余談ながらメタウィキ空間とは、ソフトウェアの解説文を翻訳するために別途、翻訳補助機能「mw:拡張機能:翻訳」を用意しています。その仕様に、ウィキ間で訳文を転用する時の基本理念を説明しています。いわばご指摘の翻訳者目線の姿勢に対して、ソフトウェア解説者の目線でしょうか。
- 訳例の説明文書。これを援用できると、百科事典(ウィキペディア)を内包するウィキメディアのウィキ全体の整合性が測れるかもしれません。
- 上記文書の内部リンク先まで順次、訳したいと思います。--Omotecho(会話) 2022年12月1日 (木) 04:54 (UTC)
コメント 私の場合、少し面倒ですが本来の手順に示されている通り、(1)第1版で履歴の継承のため原文をそのままコピペする、(2)第2版で直訳的な訳文を投下する、(3)第3版で原文を除去する、(4)直訳分を意訳しなおす、(5)独自の情報源・出典・説明文を追加する、みたいな感じで段階的に投稿します。あとあと、どの段階でやらかしたかわかりやすく、なにか手続き上のミスをしたときに後戻りしやすいように。
- 例示の「christmas holidays」の場合、第1版では「christmas holidays」、第2版で「クリスマス・ホリデーズ」、第3版で「クリスマス休暇」「年末休暇」「冬休み」「冬期休業」(全体の文脈次第で訳語を選択するかなあ。いずれにせよ日本の制度・慣習とは差異があるでしょうけど、その差異が問題になるかどうかで)にする、みたいな。
- この方法は明らかにメンドウクサイのと、あらかじめ下書きを複数用意する必要がある(メンドウクサイ)のが短所です。--柒月例祭(会話) 2022年12月1日 (木) 09:43 (UTC)
コメント @Omotechoさん コメントをお寄せいただき感謝申し上げます。上記の文はある方への返信文で、私論としてはまだスタブ状態のものです。しかしながら翻訳のあり方について「私論」を提示しておくのは私も進んで行いたいことですので、近いうちに私論をアップする予定でいます。またメディアウィキのヘルプ文書の翻訳には、好奇心旺盛な私も少し顔を突っ込んでみましたが、多言語対応がこのように進んでいくのか……、と感心したしきり。翻訳者が寄せた訳文は校閲者によって逐次レビューされ、それが結構短時間で反映されるのを見て、多数のボランティアが動いているんだな、と思いました。翻訳で起こしたウィキペディア各国語版への翻訳も、一旦校閲者の目を通さないと公表できないという仕組みがあれば良いな、と思う反面、そのシステムを維持できる人員が確保できるかどうかはすごく心配になりますし、メディアウィキ技術文書のように「各国語版の整備」が欠かせない文章とは違い、各国語版の記事は、その国ローカルの記事も多いことから、一般の記事にかかる校閲者の負担は、とても重くなることは容易に予想できます。逆に記事の翻訳の制限が緩かったことからこそ、各国語版の記事が充実していったという今までの実績は、総合的には実り多きものだったとウィキペディアの一読者として私は思います。--Licsak(会話) 2022年12月2日 (金) 04:44 (UTC)
コメント @㭍月例祭さん 翻訳手順の正しい例をご提示いただき感謝申し上げます。他言語版ウィキペディアからの翻訳を『忠実に』実行するならそのとおりになりますね。これなら履歴を見るだけで翻訳の正確性も検証しやすいのですが、ご指摘のとおり面倒くさいことがネックになっています。--Licsak(会話) 2022年12月2日 (金) 04:44 (UTC)
コメント 翻訳を広めようとするならば、原語の書き手も協力が必要になってくると思います。指摘を受け参考文章を漁っていますと、(各国語版への翻訳が不可避な)EUが出した "Writing for translation" には原文の書き手も難解な言い回し(私も翻訳の際、困った事のひとつ)や、「赤いニシン」のような、その国固有の言い回しは避けよう、とアドバイスしています。最近になってできた「やさしい英語版」ができた経緯も、その一部は翻訳による広がりを期待してものかと思います。また、多くのJAWPユーザーに日本向けにはコンテンツ翻訳機能は要らない、と言われつつも開発者がコンテンツ翻訳の実装にこだわるのは、英語版ウィキペディアについてのページの目立つところにあるジミー・ウェールズの言葉、"Imagine a world in which every single person on the planet is given free access to the sum of all human knowledge. That's what we're doing." (想像してごらん、地球上のすべての個人が、全人類の知識の集まりに自由にアクセスできる世界を。私たちがやっていることは、それなんだよ。)の実現に忠実なだけなんでしょう。ただ、これを実現しようとするならば、記事の書き手も世界的見地から相応の表現が必要だろうけれども、何よりも翻訳者は当然に、記事の書き手に対して『忠実で』なければなりますまい。
情報 蛇足ですが私、DeepLの訳文のライセンスが気になりまして開発元に質問を投げてみました。もし吉報であればライセンスの文章にクリエイティブ・コモンズやGFDLとの互換性も示されるでしょうし、そうでなければ、ライセンスにその旨が明記されるでしょう。--Licsak(会話) 2022年12月2日 (金) 04:44 (UTC)
コメント Licsakさんの「返信」を読むと、どうもLicsakさんは、「CC by-sa 3.0 (Unported)」や「GFDL」で投稿する場合、投稿者は「著作者人格権」を放棄していることを見落としておられるように思います。これらのライセンスに従って公開された文書を例えば私が編集する場合、今までの投稿者を表示さえすれば、どこをどう切り貼りしてもよいわけですし、極端な話全文を自分の文章で追き換えてしまっても(あるいは白紙荒らしであっても)、(投稿者は「編集履歴」で自動的に表示されるので)いままでの投稿者の著作権を侵害することにはなりません。投稿者が得る権利(のようなもの)は自分がその記事の編集に参加したことがあると主張できるだけで、それ以上のものではないように思います。また、これらのライセンスでは投稿者が金銭的利益を得ることができないので、裁判の対象になることがなく、判例はないと思います。--36.11.229.115 2022年12月3日 (土) 10:10 (UTC)
「CC by-sa 3.0 (Unported)」で投稿する場合、投稿者は『元になった本作品に変更が施されたことを』詳らかに説明し、かつ改変箇所を明確にしなければなりません(「GFDL」も実質同じ)。また「CC by-sa 3.0 (Unported)」では『原作者の名誉または声望に有害な歪曲、毀損、改変、またはその他の侮辱的行為』の禁止条項があります。そこで『誤訳を含む翻訳』はどうなるかというと、「原著作者が期待しうる合理的な翻訳」+「翻訳者の混入させた誤訳」+「翻訳者が訳注などで識別した意訳」とに分かれるでしょう。誤訳部分がどこであるかわからないような品質の悪い訳文ですと『原作者の名誉または声望に有害な歪曲、毀損、改変』になるでしょうし、「翻訳者の混入させた誤訳」も気づかないままになり、翻訳者の改変がどこまで及ぶか不明確になる問題があります。
- 「著作的人格権の放棄」だけを見ずに、ライセンス全文を一度読んでみてください。改変者の明確な宣言なしに、そうおいそれと無闇矢鱈な改変はできないことを知るべきですし、翻訳は原著作者の意図に反しては絶対になりません。--Licsak(会話) 2022年12月13日 (火) 22:04 (UTC)
この度、コンテンツ翻訳にて各種機械翻訳の機能が廃止されることが決まりました(プロジェクト‐ノート:翻訳検証#技術班へ申し入れ以降 (2022-10-25)参照)。これに伴い、WP:MACHINEについて改定が必要だと思ったので以下を暫定的に提案します。
- コンテンツ翻訳での機械翻訳が廃止された旨の記述。「コンテンツ翻訳拡張機能(以下、コンテンツ翻訳)は、ある言語のウィキペディアからもう一つの言語のウィキペディアへの翻訳の補助を目的とするツールです。しかし、コンテンツ翻訳での機械翻訳機能は、機械翻訳をそのままにした低品質な翻訳記事が数多く投稿されたため廃止されました」などの記述が必要かと思います。
- これは賛否両論になるかとおもいますが、機械翻訳を参考にすることは許容する旨の記述。「外部の機械翻訳(Google翻訳など)を参考程度に使う限りは問題ありません。ただ、外部サイトの機械翻訳をコピペしてそのまま投稿するのは絶対におやめください。」など。しかし、このような記述をする際には「参考程度」となる基準の制定が必要かと思いますので、そこについても意見をいただけますと幸いです。
自分はコンテンツ翻訳の機械翻訳機能の廃止による翻訳者の減少を懸念していますので、機械翻訳を完全撤廃するのではなく参考用とするのが一番だと考え、以上の提案をさせていただきます。--YellowSmileyFace(会話) 2022年11月30日 (水) 13:12 (UTC)
- ご提案助かります。取り急ぎ2点のみ。
- ちょっと長い名称なのですが、公認の「コンテンツ翻訳拡張機能」という名称をどこかに1回折り込んで、「以下……とする」と定義してもらえませんか?
提案 追記箇所〈外部サイトの機械翻訳をコピペしてそのまま投稿するのは絶対におやめください〉に、不法行為であると脚注を付けませんか? 公認の拡張機能で利用できなくなった機械翻訳システム類と、translate.google.com で手入力した原文の対訳を出力しコピペした場合、同じ扱いができるかどうか。
- 拡張機能で採用したシステムはGoogle社、Yandexと中国語特化型だったかと記憶します。いずれも財団とシステム開発会社の契約により出力結果を「コンテンツ翻訳拡張機能経由で使う場合」と指定があるのかと推測します。邪推ですが、翻訳メモリ経由で各社に役立つ使用事例という情報を渡せるからです(現実には百科事典レベルの改稿を加えた訳文は少なそう)。
- 気になるのはDeepL。このアプリの出力に魅力を感じる利用者が一定の割合でいると感じます。特性に難があり、復文を無理に短文に分断して訳すため、一見、滑らかな訳を出しますが、文意が否定であるのに肯定に誤訳する点がg社アプリとの最大の差です。下記の部分は調査不足ながらご参考まで。→
- これの出力は著作権違反でウィキメディアのウィキにコピペで持ち込めないのではないか。
- さらに試用版(無料?)と有料版の使用規約が異なるのではないか?
- --Omotecho(会話) 2022年11月30日 (水) 17:34 (UTC)
返信 (@Omotechoさん宛) ご意見ありがとうございます。1.について、暫定で上の提案(下線部分)に追加してみました。2.については、こちらの削除依頼を見ると利用規約など結構問題がありそうなので、実装には時間がかかると思います。なので、とりあえず外部の機械翻訳を参考までに、の文言を暫定的に追加しようと思うのですがどうでしょうか。--YellowSmileyFace(会話) 2022年12月1日 (木) 01:30 (UTC)
- @YellowSmileyFaceさん、早速にお返事いただき恐れ入ります。では、お手数ながら手配をお願いできましたら幸いです。
賛成 ご指摘に同意します。速やかにご提示の文言で表明。
- 別建てとして「2」ウィキ空間に持ち込めない機械翻訳サービスを一覧にする。細部、利用規約や著作権その他の確認に時間を要するため。未決事項あり。果たしてそれぞれのアプリやAPIに「誰でも思いつく位置に」明示的に利用規約で禁じているか、試用版の利用規約を含めるかなど。
- 確かに後半の「2」は頭の痛いところですね。うやむやにできないと考えますが、タイミングは今でなくても必要十分で参りたいです。--Omotecho(会話) 2022年12月1日 (木) 03:22 (UTC)
コメント 改定文のご提案、ありがとうございます。「なぜ機械翻訳が問題になるのか」を少し盛り込んだ案を書いていました。「~廃止されました」に続く項目として、以下の記述はいかがでしょうか。「外部サイト」については、(ライセンスに注意しないといけない点は従来と何も変わっていないはずですので)あえて参考に使ってもかまわないとか、よくないとかには触れず、さらっと流しています。
2022年現在、機械翻訳の主流となっているニューラル機械翻訳(NMT)は、従来の統計的機械翻訳(SMT)などと比べて精度の高い翻訳結果を出力します[NMT 1]。しかし、完璧ではありません。流暢な文に見えても、気づきにくい間違いがあります[NMT 2]。近年の研究では、従来の統計的機械翻訳の出力を使う場合よりも誤訳の見落としが多くなるとの結果が示されています[NMT 3]。NMTの出力を元にして訳文を完成するには、高度な翻訳技術が必要です。外部サイトの機械翻訳を参考とする場合も、文体を「である体」に変える、主語・代名詞等を調整する等の軽微な編集を加えたにすぎない訳文の投稿は絶対におやめください。
|
--eWikiLearner(会話)
返信 (@EWikiLearnerさん宛)
賛成 機械翻訳の仕組みと@Omotechoさんの仰る「不法行為」を合わせて記述するのが良さそうですね。--YellowSmileyFace(会話) 2022年12月1日 (木) 19:23 (UTC)
コメント 基本的な考え方ですが、オフィシャル?財団?公認で利用可能な機械翻訳が無くなったわけですから、「全ての機械翻訳サービスにおいて、(参考の程度を超えて)機械翻訳に依存したWikipedia投稿は推奨しない」を大前提として、もしどうしても使いたいとの利用者が想定されるのであれば「各利用者が、機械翻訳側に著作権が発生するか、Wikipedia投稿が機械翻訳の利用規約に抵触しないかなど、各利用者が自己責任で判断する必要がある事」、「機械翻訳を利用してWikipediaに投稿した場合、削除の方針により削除される場合がある事」(Wikipedia‐ノート:削除の方針#機械翻訳の全面的な開放についてにて議論中)を明記しておくこと、などと考えてみました。
- 「参考程度」となる基準の制定が必要とのご意見ですが、具体的な基準の制定はなかなか難しい様に思います。現行の表現「翻訳の参考とする程度に留め、翻訳結果の文章を利用しないでください」(Wikipedia:翻訳のガイドライン#機械翻訳)の表現はそのままに、あとは「削除の方針」により削除要否の判断が必要であれば都度個別判断で良い様に思います。なお、古い議論ですが「Wikipedia:井戸端/subj/翻訳ソフト・翻訳サイトの利用」「Wikipedia:井戸端/subj/かつて私はエキサイト翻訳を使っておりました」といったものが見つかりました。
- 「不法行為」に関して。恐らく「著作権侵害」や「利用規約違反(債務不履行)」を含めて「不法行為」と記されていると推察致しますが、例えばDeepL Translator (free)の場合でも「利用規約違反になる場合」(「Please note that you may not use the DeepL Translator (free) for the translation of texts containing personal data of any kind」 同サービス利用規約より)もあれば、そうではないと判断されたケース(Wikipedia:削除依頼/Wikipedia:井戸端/subj/デスクトップ版外装(スキン)改善バージョンの実装について)もあるわけですから、(どの機械翻訳サービス利用が)「不法行為であると脚注を付け」るとか「ウィキ空間に持ち込めない機械翻訳サービスを一覧にする」とかはやはり困難な様に感じます。こちらも投稿内容毎に個別判断が必要ではないでしょうか。
- 最も簡便に修正するのであれば、機械翻訳サービス毎に利用可否を掲載している「機械翻訳の著作権」の「#コンテンツ翻訳で提供されている範囲においては使用可能である機械翻訳の一覧です。(中略)富士通 ATLASシリーズ(2005年に確認)」部分の除去だけでもいい様に感じます(若しくはオフィシャル?財団?非公認との観点より全ての機械翻訳サービスの明細を挙げて「非推奨」と明記するとか)。--むらのくま(会話) 2022年12月2日 (金) 02:28 (UTC)
返信 (@むらのくまさん宛) 返信遅れてしまい申し訳ございません。著作権についての明記についてはほぼ賛成です。参考程度の基準が制定できない場合でも、ただ機械翻訳を全く使ってはいけない、との勘違いを防止するため、一応「参考とする程度に留め」ではなく「参考とする程度なら問題ないですが、翻訳結果の文章を丸々転載しないでください」といった形で、機械翻訳の参考利用を"許容"することを明記することが大事かと思いました。また、この機械翻訳は使っても大丈夫、のような勘違いを防ぐため「#コンテンツ翻訳で提供されている範囲においては使用可能である機械翻訳の一覧」の部分を一旦除去することも必要だと考えます。--YellowSmileyFace(会話) 2022年12月3日 (土) 12:52 (UTC)
返信 (YellowSmileyFaceさん宛) 「参考とする程度なら問題ないですが、翻訳結果の文章を丸々転載しないでください」への文言変更、「#コンテンツ翻訳で提供されている範囲においては使用可能である機械翻訳の一覧」の部分を一旦除去するとのお考え、に関し了解しました(「以下は翻訳結果をウィキペディアで利用できないと判明している機械翻訳の一覧です。」以降の部分も見直しが必要ではないかと考えていますが、「コンテンツ翻訳の機械翻訳廃止」とは別の観点の問題でした。必要があれば別途で検討したいと思います)。--むらのくま(会話) 2022年12月3日 (土) 13:17 (UTC)
コメント 今忙しく時間が取れないため概略的なコメントになりますが、ご容赦ください。時間ができればこの件について具体的な文面の検討や、むらのくまさんに進めて頂いている(PJ:翻訳検証参加者としては参加した方がよいのに放置してしまっていてすみません)削除方針の方にも意見申し上げようかなと思います。
- 基本的には、いくら機械翻訳の使用がライセンス上可能だとしても、過剰な使用はWP:DP#G=3によって規制されるという考えがあります。ゆえに、機械翻訳の使用が疑われる状態(この一致率は通常の書籍からの剽窃に準じます)ではライセンス問題の著作権侵害とG-3が自然と併発することになります。このことを考えると、利用者にはどの機械翻訳が使用可能かということではなく、なるべく機械翻訳を使わずに(これは機械翻訳で出力された文章を訳文のベースにしないということを意味します)記事を書いてもらうかということの方に重点を置いて考えてもらう方向性がよいと考えています。
- Google翻訳が使用不可能になったのかどうかについては、もし不可能ならばG-3案件の際に版指定削除が必要になる可能性がありますから、検討の価値があると思います。
- DeepLについてはライセンスの可否を考えてもよいとは思いますが、これはGoogle翻訳よりも強く訳文を改変しますから、使用が不可能に近いということを明記するだけで十分だと思います。DeepLを使用してはいけない理由(参考)が分からない利用者はどうせ訳文の下手さ (G-2/G-3)で問題を起こしますから、結果としては大きな問題は発生しないのではないかと思います。--Sethemhat(会話) 2022年12月3日 (土) 13:40 (UTC)
上記の通り発言の格納を行いました。
- 本題の方針の一部改訂については、むらのくまさんが仰った「各利用者が、機械翻訳側に著作権が発生するか、Wikipedia投稿が機械翻訳の利用規約に抵触しないかなど、各利用者が自己責任で判断する必要がある事」、「機械翻訳を利用してWikipediaに投稿した場合、削除の方針により削除される場合がある事」。この二つを、YellowSmilyFaceさんの「機械翻訳の参考利用を"許容"することを明記する」ことにも留意しつつ盛り込むことがまず必要かと思います。その他にも検討事項はあるでしょうし、利用可能な機械翻訳の情報など、すでにG-3により示すことがあまり意味を成さなくなっているもありますので(新しい「参考程度にする」という方針でも、文章全体を持ってくるわけではないからライセンスを考える必要は消滅したと考えます)、大幅な変更が必要とのことで、利用者:Sethemhat/翻訳のガイドライン文案にて案を練ってみたいと思います。完成しましたら差分を示すなどして、皆様に諮りたいと存じます。--Sethemhat(会話) 2022年12月21日 (水) 14:23 (UTC)
- 大幅な遅延をお詫びします。私がごたごたしており3月になってしまいましたが、一応完成しましたので提示したいと思います(利用者:Sethemhat/翻訳のガイドライン文案、現行の文章との差分)。全体的に文章の意図の明確化を目指しました。この点でコンテンツ翻訳が絡まない履歴継承の部分の文章も一部変更しています(ただし、「さて、なにを翻訳しよう?」、「翻訳の実際」に関しては本題からずれすぎるため触れていません)。皆様のご意見を盛り込むようにしましたが、万が一言及されていない等あれば申し付けて下さい。ご意見お待ちしております。--Sethemhat(会話) 2023年3月12日 (日) 12:20 (UTC)
- 全体的に率直な表現で分かりやすく、むらのくまさんのご意見も反映されており全体的に良くなったと思いました。一つだけ言わせていただくと、「機械翻訳の著作権」節の「このライセンスの下で利用できること」の「このライセンスの下で」の部分を「GFDLとCC BY-SAのデュアルライセンスの下で」に変えた方が読みやすいと思いました。その他は問題ないと思いますので、この先(2週間くらい?)異論がなければSethemhatさんの文案を盛り込む形でよいかと思います。--YellowSmileyFace(会話) 2023年3月17日 (金) 00:35 (UTC)
- すみません、一つ気付いたことがありました。「#コンテンツ翻訳で提供されている範囲においては...」の部分ですが、コンテンツ翻訳で機械翻訳が使えなくなったのでこの部分を除去することが提案されています(Ctrl+Fで「2022年12月3日 (土) 12:52 (UTC)」を入れると周辺のコメントにたどり着くことができます)。あと、この節をウォッチしていてダブル通知となってしまったら申し訳ないのですが、念のため@Sethemhatさんに通知を送らせていただきます。--YellowSmileyFace(会話) 2023年3月17日 (金) 00:42 (UTC)
- ご覧いただきありがとうございます。デュアルライセンスの点修正しました。その上で、2個目の返信についてYellowSmileyFaceさん他皆様に相談したい点がございます。
- この件反映し忘れていたのですが、@Omotechoさんの2022年11月30日 (水) 17:34 (UTC)のコメントおよび、@むらのくまさんの 2022年12月2日 (金) 02:28 (UTC)のコメントより、「コンテンツ翻訳機能での機械翻訳が廃止された以上、利用可能な機械翻訳は現在存在しない」はずです。加えて、私が2022年12月3日 (土) 13:40 (UTC)に述べた「機械翻訳の使用が疑われる程度の丸写し状態では、ライセンス問題の著作権侵害とG-3が自然と併発する」、すなわち機械翻訳を丸写しすることがG-3で規制されているということを考え合わせると、利用可能な機械翻訳を記載する必要性はなくなるはずです。Google翻訳を含むすべての機械翻訳が利用不可の状態にあるからです。ただし、Google翻訳に関しては出典としてGoogleの利用規約がつけられているものの、Wikipediaのデュアルライセンスに適合するということを示す文章は現在見つけられていません。
- ゆえに、リストを除去するのと同時に、「機械翻訳の使用は参考とする程度にしか許可されていない」ということを明文化する必要があるのではないかと思います。このとき、「過去に利用可能であったリスト」はサブページにでも記録として残しておきたいと思います。
- 12月で一応議論がストップしていたので、コメント依頼にも提出しました。--Sethemhat(会話) 2023年3月17日 (金) 11:21 (UTC)
賛成 議論の締めくくりに入ってくださり、きちんとまとめていただき、感謝しきれません。誠にお骨折りでした。
- CX2を利用した時の日本語版ウィキペディア側の編集要約欄の自動記述
質問 ところで、これは別件でスレッドを変えましょうか? この作業班では如何ともし難いのですが、その後もCX2で機械翻訳を使わずに翻訳作業をしてみると、利用者空間に出力しても「CX2を使った」という自動履歴が記入されますね。
- うーん。なんとなく居心地が悪い。ただ、以下のことを明記することが、ヘナチョコ訳文の投稿を誘うようでは本末転倒であり、考えあぐねています。
- 以下の点は、メタに申し入れるのが正道とは思います。使う人が少ない気もするので、日本語版ウィキペディアで協議する優先順位は低いと考えます。メタ側に申し入れても〈費用対効果〉は不明。(先走ってすみません、申し入れの際は@Sethemhatさんに代わってOmotechoが取り継ぎましょうか?)
- CX2では翻訳原文の言語に関わらず、日本語へ訳出するときに自動翻訳機能は停止している点。
- CX2は機械翻訳を使わなくても利用できる点。
- CX2は翻訳作業上、便利不便の両面がある点。
- 便利さ=内部リンクを自動的に照合し、翻訳原語の内部リンクが日本語版にある場合は、自動で差し変わる。
- 不便さ:意図せずエラーを発生させる。特に出典テンプレートの必須要素の差により、英語版原文にウェブ出典の閲覧日がない場合がしばしばあるため。
- 原文の編集者がURLをいつ閲覧したか調べるには、手作業である=原文の変更履歴を調べにいく必要あり。
- --Omotecho(会話) 2023年3月17日 (金) 12:48 (UTC)
コメント Sethemhatさん、文案作成有難う御座います。「機械翻訳が出力した文章は、利用者自身による訳文の参考とする程度にとどめて下さい」との基本線は賛成です。気になった点は以下の通りです。
- 「機械翻訳の著作権」の節名称変更および、それに伴う「翻訳記事に関する一般的注意事項」節のレイアウト変更を行った方がよりよいのではないか?
- 具体的には、「著作権」節を最初に持ってきて、同節冒頭部、下位節として「フェアユース」節、同「戦時加算」節の順番、次に「機械翻訳」節で、同節冒頭部(1文目は除去)、下位節として「機械翻訳の著作権」節(但し、節名は例えば「機械翻訳サービス利用規約の確認」といったものに変更)、同「コンテンツ翻訳」節とする。
- 理由。「機械翻訳」側に二次的著作物としての著作権が発生する場合も発生しない場合もあろうかと存じます(なお、一般的には発生しない場合がほとんどと存じます。詳しくは「平成5年11月 文化庁 著作権審議会第9小委員会(コンピュータ創作物関係)報告書」をご参照)。仮に機械翻訳側に著作権が発生しない場合でも、その利用規約がWikipedia投稿に問題無いことを確認する必要がありますので、「機械翻訳の著作権」との節名称は不適当な印象を持ちます。
- 機械翻訳サービス毎の利用可、利用不可表記は除去してもいいのではないか?(現行表記は判り辛く、少なくとも記載の整理が必要の様に感じます)
- コンテンツ翻訳における機械翻訳利用が廃止された現状では、公式に利用可とされる機械翻訳サービスは無く、仮に機械翻訳を利用するにしても利用者の責任で「利用規約を遵守すること」「機械翻訳に過度に依存しないこと」が求められることになろうかと存じます。一方で機械翻訳サービスの利用規約は、例えば、制約が少なそうなGoogle翻訳(利用規約)、翻訳内容によっては制約があるDeepL翻訳(利用規約)、私的利用限定で翻訳結果公表禁止のexcite翻訳(利用規約)などと機械翻訳サービス毎で様々です。これらを機械翻訳サービス単位で「利用可」「利用不可」に分類することは現実的に困難な様に存じます。また、公式にオーソライズされていない機械翻訳、例えばGoogle翻訳を、日本語版コミュニティが利用規約を検討しその責任において利用可と分類することも、実際問題、現実的では無い様にも思います。以上、日本語版コミュニティとして「利用不可」もしくは「利用可と判明していない機械翻訳=利用不可」としか分類できないのであれば、各機械翻訳サービスを列記する現行の表記は必要無いのではないかと感じます。また、列記を残す場合には、「利用不可」「利用可と判明しておらず各自で利用規約要確認(利用非推奨)」の2分類としたうえで、コンテンツ翻訳で利用できていたGoogle翻訳等の仕分け、DeepL翻訳の仕分け見直しを行い、各サービス名と利用規約の紹介を行う様にしたほうがいい様に感じます。なお2005年調査で利用可・不可とされている4つのソフトウェアですが、一利用者が個人として各社から回答を得たとの報告によるもの(エビデンスは特に無し)の様です(「Wikipedia:井戸端_(告知)/過去ログ/2005年3月#英日機械翻訳の可能性が開かれました」、「利用者‐会話:燈馬想#翻訳について」、「Wikipedia:FAQ 翻訳 2005-04-07T12:48:18UTC版(差分)」)。--むらのくま(会話) 2023年3月19日 (日) 11:00 (UTC)
- ご指摘ありがとうございます。私も、ライセンスの部分は複雑になっており整理が必要だと感じていたところでした。思い切ってライセンス部分をサブページに移植したり、むらのくまさんご提示の節順に入れ替えるなどかなり大幅に文章の変更を行いましたので、皆様にご確認いただければ幸いです(文案、私の最終コメントからの差分、現在のガイドラインとの差分)。また、文章に違和感があるなどあれば編集許可を貼っていますので直接編集して頂ければありがたいです。
- 不明なところが一件ありました。@むらのくまさん、機械翻訳節の「同節冒頭部(1文目は除去)」とは、「初心者による翻訳は時として質の悪い文章を生み出します。」を削除するということでしょうか。これは必要かと思いますが、別のところの誤りでしょうか。
- また、OmotechoさんのCX2の話はそのままPJ:翻訳検証またはその他適切なページに転記いただければ最善かと存じます。--Sethemhat(会話) 2023年3月19日 (日) 14:18 (UTC)
報告 下書きを元にして改訂を実施しました。今だ不備があれば遠慮なくお申し付けください。異論がなければ、この議論は終了とさせていただきます。議論に参加された皆様ご協力ありがとうございました。お疲れ様でした。
- 以下余談。これは着地点が見えていたため何とか終了に持っていくことができましたが、Wikipedia‐ノート:削除の方針#機械翻訳の全面的な開放についてに関しては議論がストップしています。私も一時「有意義ですから継続を希望」と言った手前申し訳ないところはあるのですが、現行の削除の方針に当該削除依頼の結果と反するものは含まれておらず、かつ明文化するという合意も得られていないと思いますし、何より私にこの削除の方針の議論を主導する気力もないことにより削除の方針の議論の方はノータッチで行こうと思います。申し訳ないです。ただしもちろん他の方が議論を再開するのをお止めするものではありません。--Sethemhat(会話) 2023年3月26日 (日) 14:45 (UTC)
Wikipedia:執筆・翻訳者の広場#コンテンツ翻訳の動作のトラブルについてで、コンテンツ翻訳の動作のトラブルに関する質問をしております。何か情報をお持ちの方は執筆・翻訳者の広場のほうでご提供いただけますと幸いです。--さえぼー(会話) 2023年1月9日 (月) 15:46 (UTC)
情報 ご質問のスレッドはリンク先を改めて記します(94337085 番前後)。ご参照にお役に立てば幸いです。--Omotecho(会話) 2023年5月9日 (火) 12:27 (UTC)
Wikipedia:翻訳のガイドライン#要約欄への記入において、「ドイツ語版、フランス語版、イタリア語版、オランダ語版、韓国語版などは、UTC ではなく現地時間(夏時間を含む)を使用する。」と記載されていますが、これはガイドラインとして現地時間の記載を推奨する(ないしUTCを使うべきではない)という意味なのでしょうか?
利用者‐会話:織原美津夫#履歴補遺が必要な記事についてにてそのようなご指摘をいただいたのですが、上記の記載は単に例示されている各言語版が(デフォルトの設定で)現地時間を表示しているということを表しているだけで、ガイドラインとして推奨までしているという意図があるように読み取ることはできませんでした。むしろ、本ガイドラインの過去版を確認すると、もともとは各言語版の標準時にかかわらずUTCに直して記載することを求めていたものが、2012年11月3日 (土) 17:03 (UTC) の版の編集で削除され、UTC以外を使用している言語版が存在するという旨を表記するようなスタイルに変更された、という経緯であり、その編集についても何らかの合意に基づいて行われたものではないようです。このため、現地時間で記載することを推奨する(ないしUTCに直すべきではないとする)ような合意は特にないものと思われました。しかし、UTCではなく現地時間の記載を「推奨する」という何らかの根拠があるのであれば、先行議論における私の発言(履歴補遺のお願いの際に現地時間で記載するよう明言しなかったこと)は結果的に不適切だったことになります。
この件について皆様のご意見を伺わせていただければ幸いです。--Dream100(会話) 2023年6月26日 (月) 11:32 (UTC)
- 意見がつかないためコメント依頼に提出しました。--Dream100(会話) 2023年7月10日 (月) 10:30 (UTC)
- ライセンス上はリンクさえあればいいので、UTC/現地時間の強制はライセンスに根拠を持たない、と申し上げておきます。ガイドラインとしての是非は私からはノーコメントとさせてください。--ネイ(会話) 2023年7月12日 (水) 08:09 (UTC)
- ■更新の経緯を拝見するかぎり、当該文章のもともとの意図は、投稿時間を用いて版指定する場合に UTC がデフォルト表示でない言語版があることに留意せよ、ということのように見えます。「現地時間(夏時間を含む)を使用する」→「現地時間(夏時間を含む)が表示されている」とするほうが誤解を招かないかもしれません。なお、基準時としてUTCを用いることを強制する必然性はないように思います。■ライセンスとしては、ネイさんのおっしゃるとおり、版の指定を必須とする合理的な理由はありません。CCにせよGFDLにせよ、ウィキペディアのような厳密なバージョン管理がされているものに限って用いられることを想定したライセンスではないからです。版の指定を求める意義は、編集の意図を第三者に明らかにせしめるという点に集約されると思います。--枯葉(会話) 2023年7月12日 (水) 13:26 (UTC)
- 皆様コメントいただきありがとうございました。少なくとも、冒頭で挙げた記載について、特定の言語版が翻訳元の場合において現地時間で記載することを「推奨する」という意図がないことは確認できました。
- Karehaさんのご指摘内容はもっともと考えます(「使用する」と記載されていることで「使用すべき」という意味を暗に含んでいるように解釈されかねず、事実先行する会話ページでの指摘もそのような理解に基づくものであったと考えています)。このため、Wikipedia:翻訳のガイドライン#要約欄への記入における表中の「タイムスタンプにより版指定」の項目内にある記述を以下の通り変更することを提案します。
- 変更前: ドイツ語版、フランス語版、イタリア語版、オランダ語版、韓国語版などは、UTC ではなく現地時間(夏時間を含む)を使用する。→参考
- 変更後: ドイツ語版、フランス語版、イタリア語版、オランダ語版、韓国語版などは、UTC ではなく現地時間(夏時間を含む)がデフォルトで表示されている。→参考
- 「デフォルトで」と付け加えたのは、各言語版の個人設定でタイムゾーンを変更できることを考慮してのものです。1週間ほど反対がなければ上記の通り変更したいと思います。--Dream100(会話) 2023年7月24日 (月) 08:56 (UTC)
- 反対がなかったので変更を行いました。--Dream100(会話) 2023年7月31日 (月) 11:55 (UTC)
情報 掲題の件につきまして、「Wikipedia:井戸端/subj/「ケースB1:履歴不継承」による削除の中断の提案」にて広く意見を求めています。この提案は現在のWikipedia:翻訳のガイドラインに一部抵触しており、そのガイドライン文書としての修正を要するものですので、ここに通知いたします。--枯葉(会話) 2023年7月10日 (月) 11:04 (UTC)