WEKO3
アイテム
{"_buckets": {"deposit": "9a1796be-e6f6-4420-8b3f-8f6676d0a498"}, "_deposit": {"created_by": 10, "id": "2000175", "owner": "10", "owners": [10], "pid": {"revision_id": 0, "type": "depid", "value": "2000175"}, "status": "published"}, "_oai": {"id": "oai:nuis.repo.nii.ac.jp:02000175", "sets": ["1713154281043"]}, "author_link": ["3235"], "item_10002_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2024-04-01", "bibliographicIssueDateType": "Issued"}, "bibliographicVolumeNumber": "7", "bibliographic_titles": [{"bibliographic_title": "新潟国際情報大学経営情報学部紀要"}, {"bibliographic_title": "Journal of Niigata University of International and Information Studies Faculty of Business and Informatics", "bibliographic_titleLang": "en"}]}]}, "item_10002_description_19": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "."}]}, "item_10002_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "深層学習の技術発展により生まれた大規模言語モデル(LLM)は人間社会を変革する発明であると期待されている。画像処理分野でも様々な人工知能(AI)タスクが高精度で達成されつつある。マルチモーダル AI では画像の輝度値パターン類似性が用いられているが、画像の意味解釈は輝度値パターンだけで簡単に計算できない。今回 MS COCO キャプションデータセットと、LLM のfalcon 7b instruct、および対称差集合の手法を用いて画像キャプション間関係性を定量する問題にアプローチした予備段階的結果について述べる。5000 画像のキャプションに対する MS COCO の 7254 トークンと、それらのキャプションから LLM で連想された 20113 トークンについて画像に関連付け、トークン集合間対称差集合要素数を画像間距離と解釈して分析結果を得た。Falcon 7b instruct(MS COCO)に関して対称差距離の最小値は 69(7)、最大値は 425(95)、共通部分要素数の最大値は 84(22)、最小値は 9(0)、和集合要素数の最小値は 105(21)、最大値は 467(101)であった。", "subitem_description_language": "ja", "subitem_description_type": "Abstract"}]}, "item_10002_description_6": {"attribute_name": "内容記述", "attribute_value_mlt": [{"subitem_description": "."}]}, "item_10002_heading_23": {"attribute_name": "見出し", "attribute_value_mlt": [{"subitem_heading_banner_headline": "【研究ノート】", "subitem_heading_language": "ja"}, {"subitem_heading_banner_headline": "\u003c\u003cStudy Notes\u003e\u003e", "subitem_heading_language": "en"}]}, "item_10002_publisher_8": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "新潟国際情報大学経営情報学部", "subitem_publisher_language": "ja"}]}, "item_10002_source_id_9": {"attribute_name": "ISSN", "attribute_value_mlt": [{"subitem_source_identifier": "2434-2939", "subitem_source_identifier_type": "ISSN"}]}, "item_10002_version_type_20": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "近山, 英輔", "creatorNameLang": "ja"}, {"creatorName": "チカヤマ, エイスケ", "creatorNameLang": "ja-Kana"}], "familyNames": [{"familyName": "近山", "familyNameLang": "ja"}, {"familyName": "チカヤマ", "familyNameLang": "ja-Kana"}], "givenNames": [{"givenName": "英輔", "givenNameLang": "ja"}, {"givenName": "エイスケ", "givenNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "3235", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "中田 豊久", "creatorNameLang": "ja"}], "familyNames": [{"familyName": "中田"}], "givenNames": [{"givenName": "豊久"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_access", "date": [{"dateType": "Available", "dateValue": "2024-04-15"}], "download_preview_message": "", "file_order": 0, "filename": "kiyo_2024.03.13.pdf", "filesize": [{"value": "1.3 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "mimetype": "application/pdf", "size": 1300000.0, "url": {"url": "https://nuis.repo.nii.ac.jp/record/2000175/files/kiyo_2024.03.13.pdf"}, "version_id": "7b3822c7-628b-4bef-bd95-3de7aaf9ed24"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "意味空間大規模言語モデル", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "LLM", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "MS-COCO", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "departmental bulletin paper", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "意味空間の画像表現について", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "意味空間の画像表現について", "subitem_title_language": "ja"}, {"subitem_title": "Image Representation of a Semantic space", "subitem_title_language": "en"}]}, "item_type_id": "10002", "owner": "10", "path": ["1713154281043"], "permalink_uri": "https://nuis.repo.nii.ac.jp/records/2000175", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2024-04-15"}, "publish_date": "2024-04-15", "publish_status": "0", "recid": "2000175", "relation": {}, "relation_version_is_last": true, "title": ["意味空間の画像表現について"], "weko_shared_id": -1}
意味空間の画像表現について
https://nuis.repo.nii.ac.jp/records/2000175
https://nuis.repo.nii.ac.jp/records/200017525856fba-4137-47c3-af9c-b35105d8b870
名前 / ファイル | ライセンス | アクション |
---|---|---|
kiyo_2024.03.13.pdf (1.3 MB)
|
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-04-15 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | 意味空間の画像表現について | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Image Representation of a Semantic space | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | 意味空間大規模言語モデル | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | LLM | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | MS-COCO | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||
資源タイプ | departmental bulletin paper | |||||||||
著者 |
近山, 英輔
× 近山, 英輔× 中田 豊久
|
|||||||||
抄録 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | 深層学習の技術発展により生まれた大規模言語モデル(LLM)は人間社会を変革する発明であると期待されている。画像処理分野でも様々な人工知能(AI)タスクが高精度で達成されつつある。マルチモーダル AI では画像の輝度値パターン類似性が用いられているが、画像の意味解釈は輝度値パターンだけで簡単に計算できない。今回 MS COCO キャプションデータセットと、LLM のfalcon 7b instruct、および対称差集合の手法を用いて画像キャプション間関係性を定量する問題にアプローチした予備段階的結果について述べる。5000 画像のキャプションに対する MS COCO の 7254 トークンと、それらのキャプションから LLM で連想された 20113 トークンについて画像に関連付け、トークン集合間対称差集合要素数を画像間距離と解釈して分析結果を得た。Falcon 7b instruct(MS COCO)に関して対称差距離の最小値は 69(7)、最大値は 425(95)、共通部分要素数の最大値は 84(22)、最小値は 9(0)、和集合要素数の最小値は 105(21)、最大値は 467(101)であった。 | |||||||||
言語 | ja | |||||||||
内容記述 | ||||||||||
内容記述 | . | |||||||||
書誌情報 |
新潟国際情報大学経営情報学部紀要 en : Journal of Niigata University of International and Information Studies Faculty of Business and Informatics 巻 7, 発行日 2024-04-01 |
|||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 新潟国際情報大学経営情報学部 | |||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2434-2939 | |||||||||
フォーマット | ||||||||||
内容記述 | . | |||||||||
著者版フラグ | ||||||||||
出版タイプ | VoR | |||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||
見出し | ||||||||||
大見出し | 【研究ノート】 | |||||||||
言語 | ja | |||||||||
見出し | ||||||||||
大見出し | <<Study Notes>> | |||||||||
言語 | en |