Googleは、ポートレートを有効にするために使用できるAIテクノロジーであるDeepLab-v3のソースコードをリリースしました Google カメラのモード。開発者は自分のアプリで同じテクノロジーを他のアプリでも使用できます。 目的。
午後 5 時 2 分 (中部標準時間) 更新: Googleは、ポートレートモード技術自体はオープンではないことを明確にするために連絡を取りました。 出典はありますが、それを可能にするテクノロジー、つまりセマンティック画像セグメンテーションが現在オープンしているということです。 調達した。 この修正を反映してタイトルが修正されました。
ほとんどの人は、Pixel 2 ファミリーが現時点でスマートフォンの中で最高のカメラを搭載していることに同意しています。 カメラのハードウェア自体は優れていますが、魔法のほとんどはソフトウェア側で起こっています。 たとえば、HDR+ 機能により、 ほぼすべてのカメラが優れています いつ 他の携帯電話に移植された. Pixel 2の新しいソフトウェア機能は「ポートレートモード」です。 あなたを識別し、背景をぼかしてクールな効果を生み出します。
カメラはこれを実現するためにセマンティック画像セグメンテーションを使用しています。 基本的に、すべてのピクセルを「人」や「空」などのラベルで分類します。 これは、カメラが前景の人物と背景の空を区別するのに役立ちます。 Google はこのテクノロジーをオープンソースとしてリリースしました。つまり、開発者は同じテクノロジーを独自のアプリで使用できます。 ポートレート モードは、このテクノロジーの使用方法の一例にすぎません。 開発者はさらに素晴らしいことを行うことができます。
このリリースには、サーバー側の展開を目的とした最も正確な結果を得るために、強力な畳み込みニューラル ネットワーク (CNN) バックボーン アーキテクチャ [2、3] 上に構築された DeepLab-v3+ モデルが含まれています。 このリリースの一環として、Tensorflow モデルのトレーニングおよび評価コードをさらに共有します。 Pascal VOC 2012 および Cityscapes ベンチマークのセマンティック セグメンテーションですでに事前トレーニングされたモデルも タスク。
出典: Google リサーチ