
YOLOとは
AIの力で画像内の映っているものを分類し、それが何かを類推することが出来る技術です。YOLOは”You Only Look Once”を意味し、「一度見れば何が映っているか分かるよ」というメッセージの略となっています。
元々、YOLOは “You only live once”「人生は一度きり」という意味のワードでもあります。
YOLOのメリット
コミュニティが充実
YOLOは広く使われているため、ネットでチュートリアルやトラブルシューティングが容易に見つかります。
特に、Ultralytics社によるエコシステムなども存在しており、 YOLOを活用したサードパーティツールやフレームワーク、データモデルがあるため、それらを利用することで開発の効率化を図ることが出来ます。
(比較的)低コスト
YOLOは高い推論速度を持つため高性能なハードウェアに依存せず、比較的低コストのデバイスでも処理が可能です。安価なシングルボードコンピュータであるRaspberry Piや、NVIDIA Jetsonで処理をさせるチュートリアルなども見つかります。
教育・学習目的への利用が容易
YOLOは比較的簡単にセットアップと実装が可能で、初心者でも扱いやすい設計になっています。これにより、エンジニア以外の人材(たとえばデータアナリストやプロジェクトマネージャー)にも利用しやすい環境が提供されます。
また比較的学習コストが低く、コンピュータビジョンの教育用ツールとしても適しています。これにより、人材育成や技術の普及に役立ちます。
YOLOの種類
台湾・中国系のオープンなもの、中国系企業のもの、Ultralytics系の3つに分けてご紹介します。
Ultralytics YOLO
AIフレームワークであるPytorchを使って書き換えた「Pytorch版 YOLO version3」をリリースしたスペインのGlenn Jocher氏が率いる企業です。当サイトでも、Ultralytics YOLOをメインで扱っています。
https://www.ultralytics.com/ja
データセット・トレーニング環境・ディプロイプロセスまでサポートすることでエコシステムともいえる仕組みを構築しています。

台湾・中国系のオープンソース
台湾の国立研究機関である中央研究院によってYOLOv9、中国の清華大学のチームによりYOLOv10がgithub上に公開されています。
また中国華中科技大学がVision Transformer (ViT)を利用したYOLOSをHugging Face上に公開しています。
https://huggingface.co/docs/transformers/main/en/model_doc/yolos
githubリポジトリはこちら https://github.com/hustvl/YOLOS
中国系企業のYOLO
中国のECサイト・口コミサイトの運営企業である美団がYOLOv6をリリースしています。
ECサイトの商品をチェックする技術として利用しているようです。
また百度がPaddlePaddleを使用しているPP-YOLOをリリースしています。
以下のPaddleDetectionというリポジトリから辿ることが出来ます。
