Apa itu Computer Vision: Penggunaan dan Manfaatnya

Apa itu Computer Vision: Penggunaan dan Manfaatnya

Jika kamu diminta menyebutkan benda-benda tertentu yang kamu temukan di taman, kamu akan dengan santai menyebutkan benda-benda seperti rumput, bangku, pohon, dll. Itu adalah tugas yang sangat mudah yang dapat diselesaikan oleh siapa pun dalam sekejap mata. Namun, ada proses yang sangat rumit yang terjadi di belakang pikiran kita. Penglihatan manusia tidak hanya melibatkan mata kita, tetapi juga melibatkan seluruh pemahaman abstrak kita tentang konsep dan pengalaman pribadi melalui jutaan interaksi yang kita lakukan dengan dunia luar. Sampai saat ini, komputer memiliki kemampuan berpikir mandiri yang sangat terbatas. Computer vision adalah cabang teknologi terkini yang berfokus pada replikasi pandangan manusia untuk membantu komputer mengidentifikasi dan memproses sesuatu dengan cara yang sama seperti manusia.

Apa itu computer vision

Teknologi computer vision
Teknologi computer vision (Algotive)

Computer vision adalah subbidang dari kecerdasan buatan (Artificial Intelligence – AI) yang berfokus pada pengembangan sistem komputer yang mampu “melihat” dan memahami dunia fisik dengan cara yang serupa dengan manusia. Tujuan utama dari computer vision adalah mengajarkan komputer untuk memahami dan menginterpretasi data visual, seperti gambar dan video.

Computer vision dalam AI didedikasikan untuk pengembangan sistem otomatis yang dapat menafsirkan data visual (seperti foto atau gambar bergerak) dengan cara yang sama seperti manusia. Ide di balik computer vision adalah untuk menginstruksikan komputer dalam menafsirkan dan memahami gambar berdasarkan piksel demi piksel. Ini adalah dasar dari bidang computer vision. Dari sisi teknis, komputer akan berupaya mengekstrak data visual, mengelolanya, dan menganalisis hasilnya menggunakan program perangkat lunak yang canggih.

Visi komputer bekerja hampir sama dengan visi manusia, hanya saja manusia memiliki keunggulan. Penglihatan manusia memiliki keunggulan konteks seumur hidup untuk melatih cara membedakan objek, seberapa jauh jaraknya, apakah bergerak, dan apakah ada yang salah pada gambar.

Computer vision melatih mesin untuk melakukan fungsi-fungsi ini di atas. Namun, computer vision harus melakukannya dalam waktu yang jauh lebih singkat dengan kamera, data, dan algoritma dibandingkan dengan retina, saraf optik, dan korteks visual. Sistem yang dilatih, diharuskan untuk memeriksa produk atau mengawasi aset produksi dalam menganalisis ribuan produk atau proses dalam satu menit. Juga, sistem ini dapat dengan cepat melampaui kemampuan manusia karena dapat mendeteksi cacat atau masalah yang tidak terlihat. Computer vision digunakan di berbagai industri mulai dari energi dan utilitas hingga manufaktur dan otomotif, dan pasarnya terus berkembang.

Bagaimana computer vision bekerja

Informasi dalam jumlah besar diperlukan untuk visi komputer. Analisis data berulang dilakukan hingga sistem dapat membedakan objek dan mengidentifikasi visual. Sebagai contoh, untuk melatih komputer agar mengenali ban mobil, teknologi computer vision memerlukan suplai besar gambar-gambar ban dan benda-benda terkait dengan ban untuk mempelajari perbedaan dan mengenali ban, terutama yang tidak memiliki cacat. Deep learning dan convolutional neural networks (CNN), adalah dua teknik utama yang digunakan untuk mencapai tujuan ini.

Machine learning menggunakan model algoritma yang memungkinkan komputer untuk mengajari dirinya sendiri tentang konteks data visual. Jika data yang cukup banyak dimasukkan melalui model, komputer akan “memandang” data dan mengajari dirinya sendiri untuk membedakan satu gambar dari gambar lainnya. Algoritma memungkinkan mesin untuk belajar sendiri, bukan seseorang yang memrogramnya untuk mengenali gambar.

Sebuah CNN membantu model machine learning atau deep learning “memandang” dengan memecah gambar menjadi piksel yang diberi tag atau label. Label-label tersebut digunakan untuk melakukan konvolusi (operasi matematika pada dua fungsi untuk menghasilkan fungsi ketiga) dan membuat prediksi tentang apa yang ia “lihat.” Jaringan saraf ini menjalankan konvolusi dan memeriksa akurasi prediksi dalam serangkaian iterasi sampai prediksi-prediksi mulai terbukti benar. Kemudian, computer vision mengenali atau “melihat” gambar dengan cara yang mirip dengan manusia.

Computer vision mirip dengan memecahkan teka-teki di dunia nyata. Seperti manusia yang merakit puzzle untuk membentuk gambar utuh. Begitulah cara kerja jaringan saraf di dalam visi komputer. Melalui serangkaian pemfilteran, komputer dapat menyatukan semua bagian gambar dan kemudian berpikir sendiri. Namun, komputer tidak hanya diberikan teka-teki berupa gambar, melainkan sering kali diberi ribuan gambar yang melatihnya untuk mengenali objek tertentu.

Sejarah computer vision

Computer vision tidak muncul secara tiba-tiba, tetapi berkembang selama beberapa dekade. Selama hampir 60 tahun, para peneliti dan pengembang telah berupaya mengajari komputer cara memahami dan memahami informasi visual. Pada tahun 1959, ahli neurofisiologi mulai menunjukkan berbagai pemandangan pada kucing dalam upaya menghubungkan reaksi di otak hewan tersebut. Mereka menemukan bahwa gambar tersebut sangat sensitif terhadap sudut dan garis tajam, yang secara teknis menunjukkan bahwa garis lurus dan bentuk dasar lainnya adalah landasan analisis gambar.

Sekitar periode yang sama, teknologi pemindaian gambar komputer pertama kali dikembangkan, memungkinkan komputer untuk mendigitalkan dan mengambil gambar. Tonggak sejarah lainnya tercapai pada tahun 1963 ketika komputer dapat mengubah gambar dua dimensi menjadi bentuk tiga dimensi. Pada tahun 1960-an, AI muncul sebagai bidang penelitian, dan upaya untuk mengatasi ketidakmampuan AI dalam meniru penglihatan manusia dimulai.

Kemudian, pada tahun 1982, ahli saraf mendemonstrasikan bahwa penglihatan beroperasi secara hierarki dan menyajikan teknik yang memungkinkan komputer mengenali tepi, simpul, busur, dan struktur dasar lainnya. Pada saat yang sama, ilmuwan data menciptakan jaringan sel yang mengenali pola. Pada tahun 2000, para peneliti memusatkan upaya mereka pada identifikasi objek. Kemudian pada tahun berikutnya, aplikasi pengenalan wajah secara real-time pertama kali ditemukan.

Standardisasi tentang cara set data visual diberi tag dan dianotasi mulai muncul pada tahun 2000-an. Pada tahun 2010, kumpulan data ImageNet menjadi tersedia. Kumpulan data ini berisi jutaan gambar yang diberi tag dalam seribu kelas objek dan memberikan dasar bagi CNN dan model deep learning yang digunakan saat ini. Pada tahun 2012, sebuah tim dari Universitas Toronto mengikuti kontes pengenalan gambar dengan sebuah CNN. Model ini, yang disebut AlexNet, secara signifikan mengurangi tingkat kesalahan pengenalan gambar. Setelah terobosan ini, tingkat kesalahan telah turun menjadi hanya beberapa persen.

Contoh penggunaan computer vision

Computer Vision memiliki berbagai aplikasi yang sangat beragam di berbagai industri. Berikut beberapa contoh penggunaan computer vision.

Mobil otonom

Teknologi computer vision
Mobil Tesla yang memiliki fitur otonom (Bernard Marr)

Computer vision memungkinkan mobil yang dapat mengemudi sendiri memahami lingkungan sekitarnya. Kamera menangkap video dari berbagai sudut di sekitar mobil dan memasukkannya ke perangkat lunak computer vision. Kemudian, memproses gambar secara real-time untuk menemukan ujung jalan, membaca rambu lalu lintas, mendeteksi mobil, objek, dan pejalan kaki lain. Mobil self-driving, atau mobil otonom ini kemudian dapat mengarahkan jalannya di jalanan dan jalan raya, menghindari rintangan, dan (mudah-mudahan) mengantarkan penumpangnya dengan aman ke tujuan mereka.

Pengenalan wajah (face recognition)

Penggunaan face recognition pada saat event G20 di Bali
Penggunaan face recognition pada saat event G20 di Bali (Liputan 6)

Computer vision juga memainkan peran penting dalam aplikasi pengenalan wajah, yaitu teknologi yang memungkinkan komputer mencocokkan gambar wajah seseorang dengan identitasnya. Algoritma computer vision mendeteksi fitur wajah dalam gambar dan membandingkannya dengan database profil wajah. Perangkat konsumen menggunakan pengenalan wajah untuk mengautentikasi identitas pemiliknya. Aplikasi media sosial menggunakan pengenalan wajah untuk mendeteksi dan menandai pengguna. Lembaga penegak hukum juga mengandalkan teknologi pengenalan wajah untuk mengidentifikasi penjahat di video CCTV.

Computer vision dalam augmented reality & mixed reality

Computer vision juga memainkan peran penting dalam augmented reality dan mixed reality, yaitu teknologi yang memungkinkan perangkat komputasi seperti smartphone, tablet, dan kacamata pintar untuk melapisi dan menyematkan objek virtual pada citra dunia nyata. Dengan menggunakan computer vision, peralatan AR mendeteksi objek di dunia nyata untuk menentukan lokasi pada tampilan perangkat untuk menempatkan objek virtual. Misalnya, algoritma computer vision dapat membantu aplikasi AR mendeteksi bidang seperti permukaan meja, dinding, dan lantai, yang merupakan bagian yang sangat penting dalam menetapkan kedalaman dan dimensi serta menempatkan objek virtual di dunia fisik.

Bidang kesehatan

Computer vision dalam bentuk alat MRI
Mendeteksi kesehatan dengan bantuan computer vision (Flickr/Liz West)

Computer vision juga telah menjadi bagian penting dari kemajuan teknologi kesehatan. Algoritma computer vision dapat membantu mengotomatiskan tugas-tugas seperti mendeteksi kanker tahi lalat pada gambar kulit atau menemukan gejala dalam pemindaian x-ray dan MRI.

Dari pengenalan objek hingga navigasi kendaraan otonom, computer vision memainkan peran kunci dalam berbagai aspek kehidupan kita. Dengan perkembangan teknologi yang terus berlanjut, kita dapat mengharapkan aplikasi computer vision yang lebih canggih dan dampak yang lebih besar pada masa depan. Dengan demikian, kita akan terus melihat perkembangan menarik dalam bidang ini, yang akan membantu memudahkan kehidupan kita dan menghadirkan solusi kreatif untuk berbagai tantangan yang kita hadapi.


Itulah informasi seputar teknologi computer vision yang berguna bagi kehidupan sehari-hari maupun industri. Kunjungi blog MetaNesia untuk mengetahui informasi lain seputar blockchain, AR, VR, dan teknologi imersif metaverse lainnya.

Tertarik untuk menggunakan layanan virtual reality dan augmented reality? Segera hubungi customer service kami melalui WhatsApp untuk bertanya dan berkonsultasi secara gratis. Rasakan juga pengalaman dunia virtual yang menakjubkan dengan bergabung bersama MetaNesia.

Bagikan ini: