今回は形状について考えてみます。
- ハンディ(手持ち)タイプ
- フレームやレールに設置するタイプ
- 被写体を回転させるタイプ
大体がこの3つに該当するかと思います。
スキャナーが動くか、被写体が動くか、その両方もあると思いますし、複数のスキャナーをフレームに設置するような3Dスタジオなどが国内にあります。
ハンディ(手持ち)タイプ
スキャナー本体をユーザーが手で持ち、被写体(胸像になる人)をぐるっと回る・あるいは正面から近づけたり離したりしてスキャンするもの。
構造光やステレオビジョンなどでリアルタイムに深度データを取得し、スキャンソフトが自動で位置合わせしていく。
メリット
- ハードウェア構造がシンプル
- 回転機構や大きな筐体がいらないため、部品点数が少なくコストを抑えやすい。
- 設置スペースが少なくて済む
- 使うときだけ手に持って被写体の周囲を動けばいい。
- 被写体が立ったままでも座ったままでも、周囲を回れる
- 被写体が軽く頭を動かしてしまっても、リアルタイムの位置合わせ機能である程度補正可能
(※ただしあまりに動くと破綻することが想定される)
- 被写体が軽く頭を動かしてしまっても、リアルタイムの位置合わせ機能である程度補正可能
デメリット
- 手ブレや動かし方次第で、データにスキャン漏れや歪みが出やすい
コツが必要。慣れるまでは取り直しが発生するかもしれない。
- 被写体が極力動かないように協力してもらう
スキャン時間は数秒~数十秒程度で終わるが、その間は顔や上半身をなるべく動かさないでもらう必要がある。
一番シンプルに作りやすく、低コスト化しやすい候補。
ハード・ソフトの完成度次第では個人ユースでもそこそこ扱いやすいはず。
フレーム/レールに設置するタイプ
半円~フル円のレール(あるいはアーム)状のフレームを組んで、そのレール上をスキャナーユニットがモーターでゆっくり移動しながら被写体を360度撮影する。あるいは、複数のステーションでパターン投影を行い、段階的に撮影する方式なども考えられる。
メリット
- ユーザーが動かなくてもいい
ボタンを押せば、カメラ(+プロジェクター)が自動で被写体の周囲を回ってくれるので、
連続撮影とかは楽そう。
- 動作が一定なのでキャリブレーションしやすい
- レールやフレームの位置精度さえ確保すれば、手ブレや移動のバラつきがない。
- ユーザーの操作負荷が少ない分、誰でも同じ結果を得やすい。
デメリット / 注意点
- フレームやモーターなどの機構が必要で、コストが大幅に上昇する (部品代+組み立て精度+安全設計)。
- 設置スペースが大きくなる
半円やフル円のフレームとなると、自宅に常設するにはやや場所を取る。 - 被写体の高さ・体格差への対応が難しい
- 胸像を撮りたい部分にうまくレンズ・プロジェクター位置を合わせるためには、フレームの高さや幅を可変にする等の設計が必要。
- 被写体が動くと破綻しやすい
- レール移動中に姿勢が変わると、スキャン再構成が崩れる。
精度と再現性を高めやすいが、小型化して個人ユーザーで手の届く価格に抑えるのはほぼ不可能に近い。
小型のレールスキャナを作っても、モーターや駆動部品、堅牢なフレームでコストがかさむ。
被写体を回転させるタイプ(回転台方式)
スキャナー自体が動くのではなく、被写体(人)が乗った回転台が自動的に回ってくれるもの。
カメラ+プロジェクターを固定している前提で1箇所から時系列で被写体の別アングルのデータを取得するようなイメージで、海外でも見られる方式です。

人が乗るサイズでなければ、YouTubeなどでDIYしてる方もいますね。

メリット
- スキャナーは固定なので、光学キャリブレーションがやりやすい
- これは精度アップに寄与する。
- 一度セットすれば機構は回転台だけで済む
- スキャン部(カメラ・プロジェクタ)の可動がないのでメカ構造は比較的簡単。
デメリット / 注意点
- 人間が回されると結構ツラい&ブレやすい
- 座っているだけならまだしも、回っている間に首や体が微妙に動いてしまう。
- 座っているだけならまだしも、回っている間に首や体が微妙に動いてしまう。
- 回転中の振動・遠心力で上半身が動きやすい
- 被写体に「じっとして」と言っても、ゆっくり回転してるだけで姿勢がずれやすい。
- 大型の回転台はコストと場所を取る
- 安価なDIY用回転台はあるが、人が乗って動くレベルのものはそこそこ高価。また安全性も要考慮。
“人を回す”のは意外と現実的でないケースが多い。ブレが起きやすく、精度を確保しにくい。
まとめ・どれが一番「マシ」か?
コスト最優先 & 設置スペース最小化
→ ハンディタイプ一択
手持ちスキャン式にして、数秒~数十秒で被写体をぐるりとスキャン。
構造はカメラ+プロジェクター(あるいは赤外線投影)のモジュールと、データを記録する小型コンピュータ(ARMボードなど)を内蔵。ソフトウェアはリアルタイムまたは後処理でメッシュ合成。
被写体が少し動いても(顔の表情が変わらない程度なら)そこそこ対応できる。
完全な一発撮りではなく、多少ユーザーがカバーしきれないアングルが出る等のトラブルは起きやすい。
簡単・失敗しにくいスキャンを目指す
→ フレームタイプ(カメラが自動移動、もしくは複数台を設置)
装置が大きくなりコストがかさむ。
DIYレベルの小さなスライダー式ならワンチャン…
ただ人間の胸像サイズをカバーするためにはそれなりに大きい可動域が要る。
これからの本命はAI生成技術の活用か?
いくつかAI生成に関する記事を投稿していますが、進歩が目覚ましく、またクラウドサービス主体になればハードウェアが模倣されても何も困らないという利点はあります。
生成AIはハンディが一番という結論でしたが、フレームを使って複数台のカメラを利用したAI活用スキャンというのも可能性がありそうです。
そちらの可能性も見つつ、設計を進めたいと思います。