[付録] 用語と語彙
あるデジタル庁系の団体の議論の中で、共通データ仕様の用語に対しデジタル庁で語彙を決めているのになぜ用語が必要なのかという趣旨の質問がありました。そこで、このコラムでは、語彙と用語につて簡単に解説します。
前記のデジタル庁で決めている語彙とは、IMIで策定された共通語彙を指しています。詳しくは、IMIの説明を参照して頂きたいのですが、項目に登録する文字列や数値の規定ではなく、項目そのものの規定です。この点で普段の会話で出てくる語彙という単語が持つ意味とはかなり違う意味で語彙が定義されています。具体的な例を見てみましょう。以下の表は「連絡先」を表現するための語彙の定義です。この表全体が「連絡先」の説明になります。
連絡先型のプロパティ
識別子 | 値型 | 説明 | |
---|---|---|---|
ic:種別 | xsd:string | 0..n | 種別の表記を記述するためのプロパティ用語 |
ic:種別コード | ic:コード型 | 0..n | 種別コードを記述するためのプロパティ用語 |
ic:メタデータ | ic:文書型 | 0..n | データのメタデータを記述するためのプロパティ用語 |
ic:説明 | xsd:string | 0..n | 説明を記述するためのプロパティ用語 |
ic:ID | ic:ID型 | 0..n | 事物に割り振られたID(識別子)を記述するためのプロパティ用語 |
ic:表記 | xsd:string | 0..n | 文字列による表記を記述するためのプロパティ用語 |
ic:参照 | ic:参照型 | 0..n | 追加情報などを参照するURLを記述するためのプロパティ用語 |
ic:画像 | xsd:anyURI | 0..n | 画像を参照するURLを記述するためのプロパティ用語 |
ic:記述 | ic:記述型 | 0..n | 種別付きの説明文を記述するためのプロパティ用語 |
ic:名称 | ic:名称型 | 0..n | 連絡先の名称を記述するためのプロパティ用語 |
ic:組織 | ic:組織型 | 0..n | 連絡先の組織を記述するためのプロパティ用語 ※連絡先が他組織に委任されているときなどに記載 |
ic:担当者役職 | xsd:string | 0..n | 連絡先の担当者の役職の表記を記述するためのプロパティ用語 |
ic:担当者名 | ic:氏名型 | 0..n | 連絡先の担当者の氏名を記述するためのプロパティ用語 |
ic:Eメールアドレス | xsd:string | 0..n | 連絡先の電子メールアドレスを記述するためのプロパティ用語 |
ic:住所 | ic:住所型 | 0..n | 連絡先の住所を記述するためのプロパティ用語 |
ic:送付先 | xsd:string | 0..n | 郵便物送付先の住所(私書箱など)を記述するためのプロパティ用語 |
ic:電話番号 | ic:電話番号型 | 0..n | 連絡先の電話番号を記述するためのプロパティ用語 ※0-9 の数字及び + – ( ) , の文字のみを使用 |
ic:内線番号 | xsd:string | 0..n | 連絡先の内線番号を記述するためのプロパティ用語 |
ic:FAX番号 | ic:電話番号型 | 0..n | 連絡先のFAX番号を記述するためのプロパティ用語 ※0-9 の数字及び + – ( ) , の文字のみを使用 |
ic:携帯電話番号 | ic:電話番号型 | 0..n | 連絡先の携帯電話番号を記述するためのプロパティ用語 ※0-9 の数字及び + – ( ) , の文字のみを使用 |
ic:Webサイト | xsd:anyURI | 0..n | 連絡先のWebサイトを参照するURLを記述するためのプロパティ用語 |
ic:対応言語 | xsd:string | 0..n | 連絡先との連絡の際に利用可能な言語名を記述するためのプロパティ用語 |
ここで「識別子」とは仮の項目名だと理解してください。データモデルを策定する時には、この識別子はそれぞれのデータモデルが準拠する規格(共通データ仕様であればNGSI V2)に合致する項目名に変換します。「値型」は、例えば”xsd:string”はNGSI V2であればTextに相当します。詳しくは各識別子と値型にリンクがありますので、クリックして確認してください。回数は最小回数と最大回数であり、説明は文字通りその項目の説明です。
データモデルを策定する際には、これらの多数の項目の候補から適切なものを選びつつ、もし不足があれば項目を追加して策定する事になります。例えば共通データ仕様の「連絡先(Contactpoint)」では、、”ic:種別”、”ic:Eメールアドレス”、”ic:電話番号”、”ic:内線番号”、”ic:FAX番号”、”ic:対応言語”を選択すると共に、新たにFORMのURLを追加して策定してあります。
この様に「語彙」と「用語」は全く違うものです。また、共通語彙はコア語彙とドメイン語彙に分かれますが、共通語彙はGIFにも取り込まれています。一方、ドメイン語彙は公的な機関では定義されていませんし、民間で定義されていてもそれがどこに公開されているのかは知る事が難しい状況です。
尚、用語は項目ごとに定義されるものです。例えば、トイレの便器は建物の建築時は蓋や便座などの付属物も含めた全体が調達や施工の単位なので、全体を一つの用語として定義するのが妥当かもしれませんが、竣工後の施設管理では修理や交換の単位である蓋や便座や洗浄ノズルと便器本体は別々の用語として定義されるべきかもしれません。但し、別々に定義されるからと言って、全くバラバラで良いわけでもありません。そこで、政府や業界団体のガイドラインや業界で普段使っている用語に出来る限り準拠して用語を策定する事が大事になります。共通データ仕様で用語を策定する際にはWGのメンバになって頂いている自治体や企業と相談しながら妥当な用語を選択する様にしています。