【旧書体甦る】ついにコンピュータで日本語の漢字すべてを使用可能に 15年かけてコード化、国際規格に登録
2017
24
イメージ
1: 名無しさん@涙目です。(宮城県) [US] 2017/12/24(日) 19:32:30.13 ID:JAmCwJ/z0● BE:601381941-PLT(13121) ポイント特典
sssp://img.5ch.net/ico/anime_kuma01.gif
コンピューターで全漢字使用可に 6万字コード化
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。
コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ5万字に上っています。
中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。
このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。
この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。
IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
■漢字とコンピューターのこれまで
戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類ありますが、このうちコンピューターが扱えるのは「べ」は3文字、「サイ」は
15文字ほどです。
また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和53年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ6000字でした。
その後、昭和54年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。
現在は、およそ1万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。
■企業や自治体も一苦労
(略)
■IT企業でも…
(略)
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
コンピューターで全漢字使用可に 6万字コード化
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。
コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ5万字に上っています。
中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。
このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。
この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。
IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
■漢字とコンピューターのこれまで
戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類ありますが、このうちコンピューターが扱えるのは「べ」は3文字、「サイ」は
15文字ほどです。
また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは
昭和53年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、
およそ6000字でした。
その後、昭和54年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに
作っていました。
現在は、およそ1万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、
対応が急がれていました。
■企業や自治体も一苦労
(略)
■IT企業でも…
(略)
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
6: 名無しさん@涙目です。(東京都) [CN] 2017/12/24(日) 19:34:40.93 ID:zI17Wdf70
( `ハ´)<丶`∀´> 搭載もインストールもさせないアルニダw
7: 名無しさん@涙目です。(庭) [US] 2017/12/24(日) 19:35:11.20 ID:eG4oDqE90
フォントは誰が用意するんだ?
19: 名無しさん@涙目です。(catv?) [CN] 2017/12/24(日) 19:37:27.36 ID:yFdZ8/Xz0
>>7
なんか大変そうだよな
なんか大変そうだよな
22: 名無しさん@涙目です。(埼玉県) [US] 2017/12/24(日) 19:38:16.42 ID:a7y1PqvO0
>>19
フォントはIPAフォントってのがすでに作成済みだったはず。
フォントはIPAフォントってのがすでに作成済みだったはず。
44: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:47:20.23 ID:KGHpsw+70
>>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。
8: 名無しさん@涙目です。(空) [GR] 2017/12/24(日) 19:35:17.23 ID:FMfFaCUQ0
もうUTF8だけで良くね?
9: 名無しさん@涙目です。(埼玉県) [US] 2017/12/24(日) 19:35:26.21 ID:a7y1PqvO0
UTF-8じゃなくて独自キャラクタセット?
10: 名無しさん@涙目です。(大阪府) [BR] 2017/12/24(日) 19:35:33.26 ID:PKItkQ0h0
中国の漢字は何文字あるの?
17: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:37:12.49 ID:M5EhgwlT0
>>10
当然といえば当然だけど総数自体はたいして変わらん
当然といえば当然だけど総数自体はたいして変わらん
11: 名無しさん@涙目です。(dion軍) [JP] 2017/12/24(日) 19:35:46.70 ID:iPWlb7CZ0
苗字旧字体だから助かるわ
12: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:35:48.31 ID:M5EhgwlT0
それ以前に常用漢字とかいう糞制度を根本的に考えなおせ
13: 名無しさん@涙目です。(庭) [US] 2017/12/24(日) 19:35:49.56 ID:Q+VTLOBt0
なべの辺じゃなかったんか
14: 名無しさん@涙目です。(東日本) [CN] 2017/12/24(日) 19:36:08.47 ID:Rvu7LWqJ0
24: 名無しさん@涙目です。(東京都) [CN] 2017/12/24(日) 19:39:38.03 ID:zI17Wdf70
>>14
シューティングのキャラでしょ
これが3つずつヒューって落ちて攻めてくるんだよね?
シューティングのキャラでしょ
これが3つずつヒューって落ちて攻めてくるんだよね?
15: 名無しさん@涙目です。(青森県) [CH] 2017/12/24(日) 19:36:39.73 ID:wemqGe0N0
Unicode埋め終わったんだ
16: 名無しさん@涙目です。(チベット自治区) [EU] 2017/12/24(日) 19:37:09.59 ID:AFeSba2S0
>渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類
これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ
「斉」「斎」「齊」「齋」などおよそ60種類
これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ
25: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:39:48.21 ID:M5EhgwlT0
>>16
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ
18: 名無しさん@涙目です。(家) [US] 2017/12/24(日) 19:37:24.37 ID:w2368IcE0
Unicodeのユの字も出てないけどバカが書いた記事かな?
30: 名無しさん@涙目です。(庭) [US] 2017/12/24(日) 19:41:21.53 ID:eG4oDqE90
>>18
NHKの一般人向けニュースだぞ
NHKの一般人向けニュースだぞ
20: 名無しさん@涙目です。(茸) [CA] 2017/12/24(日) 19:37:51.25 ID:aBrzcYD90
>>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ
21: 名無しさん@涙目です。(やわらか銀行) [GB] 2017/12/24(日) 19:37:53.04 ID:Au1+Vg0i0
漢検一級に出てくるような漢字は廃止しろよ
変換したくても読めねーから面倒くせーよ
変換したくても読めねーから面倒くせーよ
23: 名無しさん@涙目です。(神奈川県) [KZ] 2017/12/24(日) 19:38:29.39 ID:LfXOtTaM0
どうせデータ連携で化けるんだから余計な事しなくても
なきゃないで終わりなのに
なきゃないで終わりなのに
26: 名無しさん@涙目です。(四国地方) [US] 2017/12/24(日) 19:39:59.94 ID:RrvIlUnz0
しょうもない事に予算使うな
27: 名無しさん@涙目です。(東京都) [ニダ] 2017/12/24(日) 19:40:02.47 ID:QUrXN0bm0
あれ、、1日15文字くらいのお仕事?
28: 名無しさん@涙目です。(やわらか銀行) [US] 2017/12/24(日) 19:40:21.49 ID:Jp6EfYB50
こんなバカげた文字に付き合わされる欧米人も大変だな
29: 名無しさん@涙目です。(広西チワン族自治区) [US] 2017/12/24(日) 19:40:48.37 ID:7lk4EkvqO
>>1
マジか漢字ROM増設だな!
マジか漢字ROM増設だな!
31: 名無しさん@涙目です。(家) [US] 2017/12/24(日) 19:41:35.96 ID:7yqUuuIy0
草なぎも変換できるな
32: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:41:59.10 ID:0A0zdG1s0
こんなもんに15年もかかる未開の土人国
37: 名無しさん@涙目です。(新疆ウイグル自治区) [US] 2017/12/24(日) 19:44:38.33 ID:GEDJ9G/x0
>>32
貴重な天下り先だからな。
半年で終わらせたら儲けられない。
これからも日本のITは各駅停車だぜ!
貴重な天下り先だからな。
半年で終わらせたら儲けられない。
これからも日本のITは各駅停車だぜ!
33: 名無しさん@涙目です。(東京都) [US] 2017/12/24(日) 19:42:04.85 ID:dJATDXTe0
コンピュータおばあちゃん~
34: 名無しさん@涙目です。(やわらか銀行) [CN] 2017/12/24(日) 19:43:13.95 ID:BvKtoIHE0
最近認印で正しい苗字のものが見当たらなくなってきた
35: 名無しさん@涙目です。(鹿児島県) [FR] 2017/12/24(日) 19:44:05.42 ID:ezxnPrY90
フォントデザイナーの災厄
38: 名無しさん@涙目です。(茸) [ニダ] 2017/12/24(日) 19:44:45.24 ID:d8yYWPJq0
2バイトに収まって良かったね
39: 名無しさん@涙目です。(カナダ) [JP] 2017/12/24(日) 19:45:08.03 ID:AAVKFMki0
よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ
なおかつ見た目は細長くなくて、全角と同じように表示される奴な!
なおかつ見た目は細長くなくて、全角と同じように表示される奴な!
40: 名無しさん@涙目です。(宮城県) [KR] 2017/12/24(日) 19:45:09.32 ID:GAJRAkF30
山形にいたころ、「玉」の上の棒を取って「つち」と読む
苗字があったんだが、そんなのにも対応してんのかね。
苗字があったんだが、そんなのにも対応してんのかね。
41: 名無しさん@涙目です。(東京都) [ニダ] 2017/12/24(日) 19:45:48.77 ID:WlhUghpj0
え?
これ既存データどうすんの?
やるの?
ヤダよヤダヤダヤダ
これ既存データどうすんの?
やるの?
ヤダよヤダヤダヤダ
46: 名無しさん@涙目です。(埼玉県) [US] 2017/12/24(日) 19:49:35.83 ID:a7y1PqvO0
>>41
問題はそれだよな
SJIS外字領域で作った外字全部を
コード割り当てしなきゃいけないの気が遠くなるわ
問題はそれだよな
SJIS外字領域で作った外字全部を
コード割り当てしなきゃいけないの気が遠くなるわ
49: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:51:07.69 ID:KGHpsw+70
>>46
もちろん、コンバートライブラリも作っただろ。15年も税金使ったんだぜ?
もちろん、コンバートライブラリも作っただろ。15年も税金使ったんだぜ?
42: 名無しさん@涙目です。(チベット自治区) [US] 2017/12/24(日) 19:46:51.44 ID:KGHpsw+70
これは良くやった!と褒めてあげたい
43: 名無しさん@涙目です。(広西チワン族自治区) [US] 2017/12/24(日) 19:46:59.66 ID:jIHWZ1sQO
無駄な事に幾らかけたんだろうか
45: 名無しさん@涙目です。(埼玉県) [US] 2017/12/24(日) 19:48:56.15 ID:oeIk+ncu0
それでいつから使えるようになるんだ?
- 関連記事
-
-
【シェアできず破壊盗難】自転車シェアサービス終了、何千台もの窃盗や破壊相次ぎ=フランス
-
【日本は低公害車が一番手】世界を変えた車15台に日本車は3台がランクイン
-
【鷹で追い払い】「効果は抜群」 カラス「ねぐら」に天敵タカ、数千羽を追い払う 石川
-
【豪華客船】『クイーン・エリザベス』が初めて金沢港へ 客室数1045室で2000人以上収容可能 気になる料金は
-
【イラつくカタカナ語】意識高い系が使いがち、イラッとするカタカナ語録、わかりみが深いと話題に
-
「漫画村」元運営者、フィリピンで拘束
-
【映画】『007』新作、D・ボイルの後任が日系人監督キャリー・フクナガに決定!
-
【当たり障りのない】日大選手が声明文発表/全文 原文まま
-
幕末期にイギリス陸軍による日本侵攻計画が立案されていた [無断転載禁止]©2ch.net
-
【船】飛ぶように売れる豪華クルーザー ~コロナが映し出す格差
-
【コンビニ】セブンの主張覆すファミマ実験の「爆弾」、深夜閉店でもオーナーは増益 ★2
-
【ファンから引退勧告】 最年長の柏木由紀(27)、ファンから卒業を勧められる 「そろそろ、いいんじゃないの?」
-
ホンダが新型アコードを発表!!!!かっこよすぎやばい!!!
-
【お手柄】人工知能 病名突き止め患者の命救う 国内初か
-
【ホリエモン出馬】堀江貴文の公約、満員電車値上げ、江戸城再建、大麻解禁、そして「東京都オール民営化」
-