CapSolver Wajah Baru

Pembelajaran Federasi

Paradigma pembelajaran mesin yang menjaga privasi yang memungkinkan pelatihan model kolaboratif tanpa mengumpulkan data di satu titik.

Definisi

Pembelajaran Federasi adalah teknik pembelajaran mesin terdesentralisasi di mana klien (seperti perangkat, server, atau organisasi) bersama melatih model bersama sambil menyimpan data mereka secara lokal. Alih-alih mentransfer dataset mentah ke server pusat, setiap peserta melatih model pada data mereka sendiri dan hanya mengirimkan pembaruan model seperti gradien atau parameter untuk agregasi. Proses ini menghasilkan model global yang memanfaatkan sumber data yang beragam tanpa mengungkap informasi sensitif. Teknik ini banyak digunakan dalam skenario di mana privasi data, kepatuhan regulasi, atau kepemilikan data terdistribusi sangat penting.

Kelebihan

  • Meningkatkan privasi data dengan memastikan data mentah tidak pernah meninggalkan lingkungan lokal
  • Mengurangi risiko pelanggaran data dan mendukung kepatuhan terhadap regulasi
  • Memanfaatkan dataset yang beragam dan nyata untuk model yang lebih kuat dan umum
  • Meminimalkan biaya transfer data dan penggunaan bandwidth dalam sistem terdistribusi
  • Sesuai dengan komputasi tepi dan penyebaran AI di perangkat

Kekurangan

  • Desain sistem yang kompleks yang memerlukan koordinasi antara banyak node terdistribusi
  • Kinerja dapat terpengaruh oleh distribusi data yang heterogen atau non-IID
  • Beban komunikasi selama pertukaran pembaruan model yang sering
  • Rentan terhadap serangan adversarial seperti pencemaran model
  • Sulit untuk di-debug dan diawasi dibandingkan sistem pelatihan terpusat

Kasus Penggunaan

  • Melatih model penyelesaian CAPTCHA atau deteksi bot menggunakan data perilaku terdistribusi tanpa mengungkap aktivitas pengguna
  • Sistem prediksi keyboard ponsel yang belajar dari input pengguna sambil menjaga privasi
  • Model AI kesehatan yang dilatih di rumah sakit tanpa berbagi catatan pasien
  • Sistem deteksi penipuan di keuangan di mana lembaga bekerja sama tanpa bertukar data sensitif
  • Sistem scraping dan otomatisasi web yang menyesuaikan diri dengan mekanisme anti-bot menggunakan sinyal terdesentralisasi