Huawei, HiAI motorunu Huawei P20 ile piyasaya sürdü. HiAI motoru, uygulama yeteneklerini açar ve "çok sayıda AI yeteneğini" entegre eder. Özellikleri şunlardır: sahne tanıma, belge algılama ve belge düzeltme, kod algılama, yüz algılama ve daha fazlası.
Huawei başlattı Mate 10 serisi Ekim ayında HiSilicon Kirin 970 çip üzerinde sistem ile. Kirin 970, özellikle Yapay Zeka için Sinir İşleme Birimi (NPU) biçiminde özel bir donanıma sahiptir. Geçen ay, ayrıca Huawei'nin Çin pazarı için bir Google Asistan + Google Lens rakibi olan HiAssistant'ı (HiAI destekli) nasıl geliştirdiğini de gösterdik. Şimdi Huawei, Huawei P20 ile birlikte HiAI Motorunu da piyasaya sürdü.
HiAI, Huawei'nin yapay zeka bilgi işlem platformudur. Şu anda Kirin 970 telefonlarındaki özel NPU, kamera uygulamasında gerçek zamanlı nesne ve sahne tanıma gibi özellikler için kullanılıyor. Microsoft Translator'da hızlandırılmış çevrimdışı çeviri. Ancak bu yetenekler, makine öğrenimi ve sinir ağlarının genel potansiyelinin küçük bir parçasıdır. Akıllı telefonlarda yapay zekanın henüz erken olduğunu söylemek yanlış olmaz, ancak potansiyel yetenekler umut verici.
Huawei'ye göre HiAI Engine, uygulama yeteneklerini açıyor, "çok sayıda AI yeteneğini ve uygulamasını" entegre ediyor. uygulamalar daha akıllı ve güçlü." Geliştiriciler artık HiAI için DDK (Sürücü Geliştirme Kiti), SDK ve IDE'yi indirebilir Motor.
HiAI motorunun uygulama yetenekleri arasında Bilgisayarla görme (CV) motoru bulunur. Bilgisayarla Görme motoru, "bilgisayarların insan görsel sistemini simüle etme yeteneklerini" ifade eder. çevreyi hissetmek ve mekanın kompozisyonunu belirlemek, tanımak ve anlamaktır". Huawei. CV motorunun yetenekleri arasında Görüntü Süper Çözünürlüğü, Yüz Tanıma ve Nesne Tanıma yer alır (bunlar aşağıda daha ayrıntılı olarak açıklanmıştır).
HiAI motoru ayrıca bir otomatik konuşma tanıma (ASR) motoru içerir. Ancak Çin dışında açık değil. ASR motoru, insan sesini metne dönüştüren motordur ve yetenekleri arasında konuşma tanıma, konuşma dönüştürme ve metinden konuşmaya (TTS) yer alır.
Doğal dil anlama (NLU) motoru da HiAI motorunun yeteneklerinin bir parçasıdır, ancak ASR motoru gibi Çin dışında açık değildir. Bilgisayarların insan sesini anlamasını sağlar, bu da onların iletişim veya doğal eylemler gerçekleştirmesine olanak tanır. Yetenekleri arasında kelime segmentasyonu, metin varlığı tanıma, duygusal eğilim analizi ve makine çevirisi yer alır.
HiAI Motorunun özellikleri şunlardır:
- Sahne Algılama: Görüntünün içeriğindeki sahneleri tanıyarak görüntüleri "hızla kategorilere ayırır". Huawei, birden fazla sahne türünün tanınmasının şu anda yüksek doğrulukla desteklendiğini belirtiyor.
- Belge Düzeltme ve Belge Tespiti: Belgenin açısını düzeltebilen bir yardımcı geliştirme işlevidir. Ayrıca görüntüdeki belgenin konum bilgisini de otomatik olarak tanıyabilir.
- Yüz Algılama ve Yüz Karşılaştırması: Huawei şunu belirtiyor: "Yüz tespitinde kişinin konumu, karakteristik noktaları ve duruşlarına ilişkin bilgiler Belirli bir görüntüdeki insan yüzü algılanıyor ve yüksek hassasiyetli yüz dikdörtgen koordinatları döndürülüyor."
- Resim Kategorisi Etiketi: Bir görüntüdeki nesneler, sahneler ve davranışlar gibi bilgileri derin öğrenme yöntemini temel alarak tanımlar.
- Görüntü Süper Çözünürlüğü: Derin öğrenmeye dayalı olarak bir görüntüyü akıllıca büyüttüğü söyleniyor. Ayrıca daha net ve daha keskin bir görüntü için çözünürlüğü değiştirmeden bozulmaları da bastırabilir.
- Karakter Görüntüsü Süper Çözünürlük: Karakterler içeren bir görüntüyü dokuz kat büyütebilir. Ayrıca görüntüdeki karakterlerin tanımını da "geliştirebilir".
- Kod Algılama: Huawei'ye göre, "Kod algılama, kodların içerdiği bilgileri elde etmek için hızlı yanıt (QR) kodlarını ve barkodları okur ve böylece ilgili hizmetleri daha sonra sağlar. Kod algılama yeteneği uygulamalara entegre edilmiştir."
Geliştiriciler artık HiAI Engine'in DDK, SDK ve IDE'sini kaynak bağlantıları aracılığıyla indirebilirler.
XDA Üyesine teşekkürler Evrimler ipucu için!
Kaynak: HuaweiKaynak 2: HuaweiKaynak 3: Huawei