YOLOとは

目次

YOLOとは

AIの力で画像内の映っているものを分類し、それが何かを類推することが出来る技術です。YOLOは”You Only Look Once”を意味し、「一度見れば何が映っているか分かるよ」というメッセージの略となっています。

元々、YOLOは “You only live once”「人生は一度きり」という意味のワードでもあります。

YOLOのメリット

コミュニティが充実

YOLOは広く使われているため、ネットでチュートリアルやトラブルシューティングが容易に見つかります。

特に、Ultralytics社によるエコシステムなども存在しており、 YOLOを活用したサードパーティツールやフレームワーク、データモデルがあるため、それらを利用することで開発の効率化を図ることが出来ます。

(比較的)低コスト

YOLOは高い推論速度を持つため高性能なハードウェアに依存せず、比較的低コストのデバイスでも処理が可能です。安価なシングルボードコンピュータであるRaspberry Piや、NVIDIA Jetsonで処理をさせるチュートリアルなども見つかります。

教育・学習目的への利用が容易

YOLOは比較的簡単にセットアップと実装が可能で、初心者でも扱いやすい設計になっています。これにより、エンジニア以外の人材(たとえばデータアナリストやプロジェクトマネージャー)にも利用しやすい環境が提供されます。

また比較的学習コストが低く、コンピュータビジョンの教育用ツールとしても適しています。これにより、人材育成や技術の普及に役立ちます。

YOLOの種類

台湾・中国系のオープンなもの、中国系企業のもの、Ultralytics系の3つに分けてご紹介します。

Ultralytics YOLO

AIフレームワークであるPytorchを使って書き換えた「Pytorch版 YOLO version3」をリリースしたスペインのGlenn Jocher氏が率いる企業です。当サイトでも、Ultralytics YOLOをメインで扱っています。

https://www.ultralytics.com/ja

データセット・トレーニング環境・ディプロイプロセスまでサポートすることでエコシステムともいえる仕組みを構築しています。

YOLO EcoSystem https://www.ultralytics.com/ja

台湾・中国系のオープンソース

台湾の国立研究機関である中央研究院によってYOLOv9、中国の清華大学のチームによりYOLOv10がgithub上に公開されています。

また中国華中科技大学がVision Transformer (ViT)を利用したYOLOSをHugging Face上に公開しています。

https://huggingface.co/docs/transformers/main/en/model_doc/yolos

githubリポジトリはこちら https://github.com/hustvl/YOLOS

中国系企業のYOLO

中国のECサイト・口コミサイトの運営企業である美団がYOLOv6をリリースしています。
ECサイトの商品をチェックする技術として利用しているようです。

また百度がPaddlePaddleを使用しているPP-YOLOをリリースしています。
以下のPaddleDetectionというリポジトリから辿ることが出来ます。

https://github.com/PaddlePaddle/PaddleDetection

 
 
  

当サイトの記事の一部はAIにより執筆されています。内容について最新の情報とは異なる場合も御座いますのでご留意くださいませ。最新の情報をご確認くださいますようお願い申し上げます。

よかったらシェアしてね!
目次