@techreport{oai:nuis.repo.nii.ac.jp:02000210, author = {河原, 和好 and 南雲, 彩花 and Yamamoto, Ryo and 山本, 亮 and 市川, 健太 and 藤田, 晴啓}, month = {2024-05-17}, note = {先行研究では,疑似ラベルを教師とする畳み込みニューラルネットワーク(CNN)を用いて須恵器の特徴量を抽出し,その特徴量に基づきk-means法によるクラスタ解析を行った。しかし,Grad-CAM等による確認では,畳込み層による特徴抽出では局所的な情報を抽出していると見られるが,全体的な構造を捉えきれているかは確認できていなかった。本研究では深層生成モデルにおける潜在空間から得られる特徴量表現を用いたクラスタリング手法の有効性を検討する。本手法は,潜在空間から須恵器の3次元データを再構成することで,大域的な情報の妥当性を評価することが可能であると考えられる。  VAEにて入力した3D形状を再構成の途中で取得される潜在変数を使ったクラスタリング手法を試みた。入力データは128x128x128ボクセルで1000Epochでは須恵器形状をかなりの精度で再構成できた。潜在変数1024次元にてクラスタリングを試みたが明瞭にまとまったクラスターはみられなかった。(20231229 スライド)  VAEは潜在変数を正規分布にしたがう連続的な変数としているのに対し、VQ-VAE(ベクトル量子化変分オートエンコーダ)の潜在変数は離散的なベクトルになる。自然界の事象は離散的なものが多く、VQ-VAEを使い二つのモデルを開発した。  モデル1(20240227 スライド)は学習率0.001、Epoch 300。モデル2(20240304 スライド)は学習率0.0002、Epoch 1000とした。ふたつのモデルは16384次元の潜在変数をともに使用し比較を行なった。結果はモデル1はクラスターのまとまりがよい結果となった。須恵器の型式を連続的なものではなく、離散的なものと考えれば、潜在変数を16384にした場合では明らかに3集団に分かれている。Ⅱ-5 だけのクラスター、Ⅱ-3,4,5が混在したクラスター、Ⅱ-1および2が中心となるが、端の方にⅡ-3や4が混在するクラスターで形成された。モデル2はクラスターがまとまらず連続したかたちとなった。一方モデル2の方が再構成の精度が安定している。  モデル1で明瞭にクラスタが分かれたのは、おそらく蓋の稜線の有無が大きく作用したのではないかと推測されるが、他方Ⅱ-5だけで固まったクラスターの説明がつかない。クラスターのまとまりを作ったⅡ-5型式のものは、実物を観察すると底がすぼまる特徴的な形態のものが多い。  VQ-VAEは引き続き学習率およびEpochがクラスターのまとまりを変動させる原因の究明とVQ-VAE2等の他のモデルによる解析を検討する。}, title = {深層生成モデルVAEおよびVQ-VAEの潜在空間を使った須恵器のクラスタリング}, year = {}, yomi = {カワハラ, カズヨシ and ナグモ, アヤカ and ヤマモト, リョウ and イチカワ, ケンタ and フジタ, ハルヒロ} }