Osaka, Jepang – Panasonic Holdings Corporation (selanjutnya disebut sebagai Panasonic HD) telah mengembangkan teknologi baru yang dapat mengurangi setengah biaya persiapan data (mengumpulkan dan menganotasi kumpulan data dalam jumlah besar) sambil menekan penurunan akurasi deteksi.
Dalam beberapa tahun terakhir, penerapan AI telah berkembang di berbagai bidang seperti fasilitas umum dan kendaraan, mendukung keselamatan dan keamanan hidup dan pekerjaan. Sejumlah besar data pelatihan diperlukan untuk mengembangkan model AI yang mampu mendeteksi objek seperti orang dan mobil dari gambar secara akurat. Dalam setiap kasus, perlu untuk memperoleh data pelatihan dalam jumlah besar dan menganotasi objek dalam gambar setiap saat. Untuk alasan ini, sejumlah besar waktu dan uang diperlukan untuk menyiapkan data saat menyebarkan AI yang dikembangkan ke berbagai situs dengan lingkungan berbeda, dan permintaan akan teknologi yang dapat mengurangi biaya persiapan data semakin meningkat.
Teknologi Adaptasi Domain Few-shot yang baru dikembangkan*2 memungkinkan penyebaran model AI ke situs lain dengan akurasi tinggi, menggunakan data pelatihan yang jauh lebih sedikit daripada yang diperlukan sebelumnya, bahkan untuk situs dengan lingkungan yang sangat bervariasi. Bertujuan untuk menerapkan teknologi ini ke berbagai bisnis dan solusi untuk Grup Panasonic, kami melanjutkan dengan percobaan demonstrasi menggunakan berbagai data lapangan. Kami telah dapat menunjukkan keefektifan metode ini dalam deteksi objek.
Ringkasan:
Untuk mewujudkan model AI yang akurat, penting untuk menyiapkan sejumlah besar data pelatihan melalui pengumpulan dan anotasi data, yang membutuhkan banyak waktu dan uang. Untuk mengatasi dilema ini, teknologi yang mewujudkan model AI berperforma tinggi bahkan dengan sejumlah kecil data menarik perhatian komunitas riset.
Salah satunya adalah “Adaptasi Domain Beberapa Tembakan”, yang mengadaptasi pengetahuan sebelumnya dari model AI yang dilatih pada sejumlah besar data berlabel yang tersedia untuk umum (data domain sumber) ke domain yang berbeda dengan hanya beberapa contoh berlabel (domain target) . Pendekatan ini berguna ketika data berlabel dalam domain target langka atau mahal untuk diperoleh, karena hanya sejumlah kecil data di tempat yang perlu disiapkan. Namun, ketika tampilan domain sumber dan domain target berbeda secara signifikan, misalnya dengan citra RGB (sumber) dan citra inframerah (target), metode konvensional tidak dapat mengisi kesenjangan pengetahuan (domain gap)*3 di antara keduanya. Hal ini menyebabkan penurunan akurasi deteksi objek.
Oleh karena itu, untuk menjembatani kesenjangan domain yang dibuat saat domain target berbeda secara signifikan dari domain sumber, kami mengembangkan algoritme Adaptasi Domain Beberapa Tembakan baru dengan metode augmentasi data yang mensintesis banyak gambar. Dalam metode ini, celah domain dikurangi dengan mengganti bagian citra domain sumber dan citra domain target. Selain hanya mengganti gambar, juga mempertimbangkan posisi dan probabilitas keberadaan objek pada gambar dengan menggunakan informasi area objek (mobil, orang, dll.) pada gambar untuk mengganti objek yang sejenis satu sama lain.
Kami juga menggunakan pembelajaran permusuhan untuk mendorong model AI mengenali fitur-fitur yang umum untuk kedua domain. Pembelajaran permusuhan adalah teknik pembelajaran mesin yang melatih model dengan membuatnya bersaing dengan model lain yang mencoba menipunya. Kami menggunakan ini untuk melatih model AI untuk mengidentifikasi domain dari setiap piksel, sambil memperbarui model AI agar gagal mengidentifikasi domain secara sengaja. Akhirnya, model AI tidak dapat lagi membedakan antara domain sumber dan target dan mampu mengenali fitur yang umum untuk kedua domain.
figurasi metode yang diusulkan
Konfigurasi metode yang diusulkan ((a) Object Aware Cross-Domain CutMix (OCDC), (b) Label Diskriminator Berbasis OCDC (OCDCDL))
Melalui kecerdikan ini, kami telah menyadari metode Adaptasi Domain Beberapa Tembakan yang efektif bahkan ketika tampilan domain sumber dan domain target berbeda secara signifikan, yang mungkin sulit diatasi dengan metode konvensional.
Prospek Masa Depan:
Metode Adaptasi Domain Few-shot yang baru dikembangkan memungkinkan penyebaran model AI ke situs lain dengan akurasi tinggi, menggunakan data pelatihan yang jauh lebih sedikit daripada yang diperlukan sebelumnya, bahkan di lingkungan dengan celah domain yang besar dan mempercepat penerapan sosial teknologi AI yang memecahkan masalah dalam kehidupan sehari-hari dan masyarakat.
Selain itu, dalam kasus penggunaan di mana sulit untuk mengontrol kondisi perolehan data pelatihan, model AI yang sangat akurat dapat disediakan dalam waktu singkat dan dengan biaya rendah, sehingga diharapkan dapat berkontribusi, misalnya mempersingkat periode implementasi untuk solusi di tempat yang memiliki berbagai target dan situasi penginderaan (perbedaan tampilan, posisi kamera, kondisi pencahayaan, dll.) untuk setiap lokasi pemasangan dan mengurangi waktu pengembangan teknologi pengenalan untuk pengawasan IR di tempat terbuka/gelap. Kami akan terus mengerjakan penelitian dan pengembangan teknologi AI yang berkontribusi pada kebahagiaan pelanggan kami.
Bagian dari teknologi ini dipresentasikan pada konferensi puncak bergengsi ACCV*4 di bidang pengenalan citra dan visi komputer. Merupakan kehormatan besar bahwa penelitian kami diakui secara internasional di bidang penelitian yang penting untuk implementasi sosial AI.[***]/ril/foto : news.panasonic.com