「日本の住所のヤバさ」がTwitterトレンド入り [256556981]
■ このスレッドは過去ログ倉庫に格納されています
「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっているためだ。
6月4日のテレビ番組で、マイナンバーカードに記載される住所をめぐり、河野太郎デジタル大臣が「将来的にはAIの技術を使って住所の表記揺れを判断することがあり得るかもしれない」と発言し、住所の正規化についてネットで議論になっていたことがきっかけだ。
記事は、「日本の住所システムがカオスで、その計算機的な処理がいかに困難か」を解説する内容だ。
まず、日本にはそもそも、新旧の2つの住所システム(A町1丁目3番2号/A町1234番地)が併存しており、例えば、「浦安市舞浜2」の住所が「舞浜2丁目」「舞浜2番地」の2系統あるケースを紹介。
さらに、まったく同じ住所表記が異なる複数の建物に付与されているケースや、表記を勘違いして入力するユーザーがいること(「八街市」(やちまたし)を「8街市」にする)――など、住所正規化・名寄せに立ちはだかる多くのハードルを解説している。
読者からは「確かに大変だ」「想像以上のヤバさ」「無理ゲー」などの感想が届いている。
また、位置情報サービスを提供するGeoloniaの宮内隆行CEOが2020年にQiitaに書いた記事「日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。」をirunoさんは紹介し、「ぜひそちらもご覧になってください」と案内している。
https://news.yahoo.co.jp/articles/b179547f31a96d2469198e5872859bb221aeb4f7 >>5 配達の人が手で持ってくるよ(欠損で頭に乗せてくる奴とかは除く)
それとこれとは別問題だろ
住所ヤバいからって郵便物はちゃんと届いてるから郵便局は
それでやれてるわけじゃん
住居表示を実施している地区では地番表示は使わねえよ普通
正しい文字が使われるとは限らない
さて、これだけ様々な例外を全部潰してブリリアントなシステムを構築したとしても、最大の障壁は「人間は正しく住所を入力してくれるとは限らない」という点にあります。前出の千葉県八街市が良い例で、「は」を「ハ」とカタカナで書いたのを「8」と読み間違えて、「八」が入力されることは決して低い確率ではありません。
また、同じ千葉県で、香取市役所の住所は「千葉県香取市佐原ロ2127」ですが、僕も初見はこれ「さわらぐち」と読んでいました。正解は「さわら ろ」です。必然的に「佐原口」という入力が極めて頻繁に降ってきます。自分で書いててもどっちがどっちか分からなくなります。
https://www.city.katori.lg.jp/smph/sightseeing/machinami/index.html この手の文字の混在でダントツでカオスなのはハイフンで、ありとあらゆるパターンの「ハイフンみたいな文字」が使われます。ハイフンとマイナスは違うのかー、ダッシュも別の概念なんだな、などと勉強になること甚だしいですが、それにしたって罫線はないだろがよ、もはや言語ですらねえぞとキレても許されると思います。
区画整理してる土地は役所が持ってるデータにばらつきがあってどれが本当なのか分からないぐらいグチャグチャになってることも
登記に書いてある地番といわゆる住所はけっこうと言うかかなり違うとは聞いた
Google様のplus codeを使わせてもらおうぜw
建物だけじゃなくて、例えばこれからの時期花火大会にピザデリバリーとかも依頼できるし
>>34 住所は被ってる地域はあるから
配達も間違える人はいる
>>34 郵便局には数年遡れる住所録があり、宛名不明にならないよう配達員がそれらを入念に見比べてる
不正確な住所のはがきの正確な住所録調べるために30分使ったりする
>>45 それジャップランドだけの問題じゃなさそうだけど
日本のでたらめな住所表示は今始まった話じゃありません
マイナカードの問題から目を背けようとしないでください
>>23 40年で俺の住んでるところ3回くらい住所が代わったぞ
簡単に変えられるんじゃないのか
>>47 そんなもんこそパソコンでやれよって話じゃん
今まで何してたの
輸出の仕事をやってるけど海外のほうがカオスだぞ
香港は郵便番号という概念がない
アラブ首長国連邦は元々は遊牧民だから住所という概念がないから、郵便物は私書箱に届けられてみんなそこに取りに行く
前に地名を覚えてみようと思って各都道府県ごのの地名が載ってる本見たら
京都府だけ他の3倍くらい分厚かった
AIで判別するって本当に河野てマヌケだったんだな・・・
>>38 イロハって地名が千葉県にあったなそういや
>>49 プレートが毎年10cmくらい動いてるから緯度経度で書くといつの間にか隣の土地になってる
東京都の23区以外で市区町村のところに区を書く人、馬鹿ですw
郵便番号あるし町名未満は地元民が知ってれば問題ないだろ
元の家を分割したミニ戸建なんか全部住所同じらしいな
ハイフンと漢数字の一が縦表記と横表記の混同で同じに見えるようになってまったことあったな
そこをなんとか判断できなきゃAI使う意味ないよね~
うちのボロ団地は団地名も部屋番号も要らず番地までで届く
紛らわしいというか何というか役所でちょっと混乱した
だったら今から新住所割り振れよ
IT的には新住所使って慣用的には旧住所使えば良いだろ
それこそデジタル庁主導でやれば良いじゃん
物流業者と郵便業者から聞き取りして不満点を改善しろよ
アメリカはホントわかりやすくてよかったわ
通り名と番号だから、バカでもわかるw
これは国だけじゃなくて民間レベルでもそうだよ
企業でも組織毎にデータがばらばらで統一できないことはよくある
立ち上げたときにデータの正規化まで目が向かなかったのは時代のせいなのかもしれないけど
是正もされないからずるずる損ばかりしている
日本の非合理性の悪いところを煮詰めたような問題だな
どうしても判断に困るやつは判断不可能として出力するとかw
既存の住所なんか捨てて郵便番号みたいな全国統一されたコードで管理すればいいだろ?
123-4567-89abcdみたいな感じで割り振れば
>>75 これでいいと思うけど分筆とかするときどうなるの?
ニホンガーw
何でネトウヨは日本だけが特別だと思うのだろう
地名変更で名寄せって昔からやってるし、その結果かえって分かりにくくなった地名もあるだろうしw
郵便番号をもうちょい長くして細かくすりゃ良かったのに
別に同じ場所に複数の住所が割り振られてるのは構わないだろ逆は困るけど
>>74 無理だよ
住所再登録する必要があるじゃん
おまえ民間サービスの住所変更一個一個できるか?
京都だけ碁盤の目になってるから特殊だけど慣れれば一発でわかるから便利
外国でも住所は~通りのどこそこが一般的だし
むしろ他の区画が全く整備されてないせいでごちゃごちゃっていう酷さ
>>80 本来なら郵便番号+(丁目)+番+号+(部屋番号)で表すことが可能なんだけどな
3つの単語でめちゃくちゃ細かいところまで指定できる地図アプリあったろ
あれ使えよ
>>74 plus codeみたいな座標コード別途普及させるのがいいと思うんだよね
問題はスマホとか座標地図無しだと、場所が特定できない事だが、今どきないだろw
>>61 なにが正しいかのルールがないのだから、AIには判断不可能
おっちゃんがわかるのは経験則
>>55 すごい挑戦だな
俺は全くやろうと思わないから尊敬するよ
統一感ゼロだしなこの国
街中みりゃわかる、ごちゃごちゃしてて汚い
同じ住居表示で2棟あったりするじゃん?
バカみたいな国だよ
>>53 あまりにも人為的に作られたルールが多すぎて、パソコンで機械的に処理するのが難しいって趣旨の記事だぞ
うちの所の群は間に別の町が入ってて飛び地になってるし
もう群要らないだろ群が無いとわからん住所も無いし
こいつのせいで住所欄が狭いんだが
まあこれは統一した方がいいな
アメリカは~とかヨーロッパは~とか言っても、日本は廃藩置県からまだ200年も経ってないし仕方ない
住居の地番決めて、名字名前で使える漢字を決める
移民受け入れる前にこれくらいは管理しないと
元の仕組みがおかしいものをIT化できるわけないんだわ
マイナの中央サバにまとめて管理するわけじゃないからどうでもいいだろ
毎回自治体役所に問い合わせる馬鹿住基システムなんだろ?
>>104 整合するだけやん
何も難しいことはないどころか
データで合わせるとかパソコン系の一番得意なとこやんけ
ジジイが難しいと思ってるだけやろがい
細かい地名が多すぎて管理が大変というので昔の地名を変えたりしてたけど、そのやり方も結構行き当たりばったりだったという事だろうw
面白い記事だったけど、泣き言言うなと言いたいな。
住所のパースが大変だというのは分かったけど
一つの万能パーサーを作ろうとするから上手くいかないんで
特殊ケースが発生する郵便番号ごととか、自治体ごとに、
住所パーサーを分けて作りゃいいだけなんじゃねえのと思った
>>94 最近はウサギ小屋用の文筆が多すぎてすぐに破綻するぞ
郵便番号が役に立って無いんだよな
もう2桁増やして郵便番号だけで建物特定できるようにすべき
DM数万件出すと10%くらい帰ってくるんだよ
もちろん転居してるのもあるがジャップの住居表示がクソすぎて配達員がたどり着けないパターンも相当ある
マジで誰か解決してよ
>>75 同じ地名ありすぎだけどな
Columbusとか全部の州にあるんじゃない?
>>70 上る下るって地名はもれなく何丁目何番地って表示が二重についてるから
その羅列みて力尽きた
これって省略せずに正規表現すれば問題ないんだよね
実際に住基ネットが稼働してるわけだし
まあオンライン上の住所(経度緯度のナンバーとか)割り振って国以外使わないとかなら可能かもしれないけど
俺んちの正式住所111の1とかだぞ
平仮名の「の」が入ってる
皇居の中心にでも勝手に基準つくって
グリッド引いてやればいいじゃん
日本語あるあるでその地域の俺様ルールがあるだよね
郵便局や配達関係が今だに人力なのは、それも理由航空法とか有るけど
郵便局もクロネコ佐川も優秀だし
グーグルマップも優秀だから
今さらどうでもええわ
住所入力だって郵便番号入れれば
ほぼ最後まで出てくるくらい優秀だしな
というか郵便番号優秀すぎだわ
■ このスレッドは過去ログ倉庫に格納されています