Ikhtisar algoritma kompresi lossy. Aplikasi praktis dari algoritma fraktal Evaluasi kompresi gambar dengan metode fraktal

Namun, mungkin karena komponen komersial dari pekerjaan ke arah ini dan, sebagai akibatnya, kurangnya deskripsi yang memuaskan dari algoritme yang dipertimbangkan, modifikasi yang diusulkan lebih dianggap sebagai hasil improvisasi intuitif dan spontan, daripada hasil yang masuk akal. hasil dari serangkaian percobaan komputasi tertentu. Pada saat yang sama, setiap peneliti yang memulai jalur di area ini membutuhkan analisis komparatif menyeluruh dari algoritme utama.

Tujuan dan sasaran

Tujuan dari pekerjaan ini adalah untuk melakukan analisis komparatif dari algoritma dasar, untuk menetapkan fitur pemilihan blok domain, untuk menguji metode pendekatannya untuk meningkatkan efisiensi kompresi. Tujuan ini dicapai melalui perubahan metode pemilihan blok domain dan metode pendekatan.

Ide dari pekerjaan ini adalah pengembangan modifikasi baru dari metode pemilihan blok domain dan metode pendekatannya ke dalam blok peringkat untuk meningkatkan efisiensi pengkodean.

Untuk mencapai tujuan ini dalam pekerjaan master, tugas-tugas berikut ditetapkan dan diselesaikan:

Studi sumber sastra dan analisis teoritis algoritma kompresi gambar lossy.
Pembentukan fitur fungsi algoritma untuk kompresi gambar fraktal, pengembangan perangkat lunak yang mengimplementasikannya.
Pembentukan satu set gambar, melakukan eksperimen komputasi untuk menetapkan fitur pemilihan blok domain dan perkiraannya, analisis komparatif hasil, perumusan kesimpulan.
Modifikasi tahapan individu dari algoritma, pembentukan versi barunya.
Pengembangan komponen perangkat lunak yang relevan, percobaan, hasil perbandingan pekerjaan.

Subyek penelitian adalah algoritma kompresi citra lossy.

Objek penelitian adalah algoritma kompresi citra fraktal.

Metode penelitian meliputi eksperimen komputasi, analisis komparatif hasil, metode numerik, metode aproksimasi matematis, pemrograman berorientasi objek.

Dugaan kebaruan ilmiah

Kebaruan ilmiah dari penelitian yang telah dilakukan dan direncanakan dalam pekerjaan diasumsikan sebagai berikut:

Perangkat lunak telah dikembangkan yang mengimplementasikan algoritma dasar kompresi fraktal dan memungkinkan analisis komparatif.
Eksperimen komputasi dilakukan, analisis komparatif dibuat, dan fitur pemilihan blok domain dalam algoritme dasar terungkap.
Analisis penerapan model pemetaan blok gambar nonlinier.
Modifikasi baru dari algoritma diusulkan untuk meningkatkan efisiensi kompresi.

Deskripsi hasil pekerjaan

Deskripsi studi

Pada tahap saat ini, penelitian telah dilakukan pada dua algoritme untuk kompresi gambar fraktal - algoritme dasar dan FE, yang dijelaskan dengan baik dalam literatur. Mereka dapat diklasifikasikan sebagai yang utama.

Algoritme dasar secara konvensional mencakup langkah-langkah berikut.

Langkah 1. Satu set blok domain dipilih pada gambar f. Mereka dapat tumpang tindih, dan jumlah tumpang tindih ditentukan oleh parameter yang disediakan secara khusus.

Langkah 2. Gambar dibagi menjadi blok peringkat yang tidak tumpang tindih (R k ). Ukurannya mungkin tidak sama dengan partisi quad-tree adaptif dengan ukuran blok variabel digunakan. Hal ini memungkinkan untuk mengisi bagian kecil gambar secara padat dengan blok peringkat yang berisi detail kecil.

Langkah 3. Blok domain dicari untuk setiap blok peringkat. Dalam hal ini, perubahan orientasi domain disediakan (3 opsi rotasi, 2 opsi rotasi dengan refleksi, 2 opsi refleksi, dan opsi ke-8 - orientasi asli tanpa perubahan). Untuk setiap opsi orientasi, domain dikompresi ke ukuran blok peringkat dan nilai optimal dari koefisien a ij dan b ij dari transformasi dihitung

dengan metode kuadrat terkecil dan dengan rumus

hitung nilai normalisasi dari parameter L(R k , D" ij) , yang mencirikan korespondensi dari blok domain ke-i terkompresi yang diubah w ij (D" ij) dalam orientasi ke-j ke blok peringkat R k . Di sini r xy ∈ R k , d xy ∈ D" ij , D" ij adalah blok domain ke-i dalam orientasi ke-j, dikompresi menjadi ukuran blok peringkat, N R k adalah jumlah piksel dalam peringkat memblokir. Pada langkah ini, algoritme bekerja dalam salah satu dari dua mode, yang dipilih oleh pengguna, dengan atau tanpa mencari domain terbaik. Dalam mode pencarian domain terbaik untuk setiap peringkat, semua domain disortir, dan domain ke-i dan orientasi ke-j dipilih, yang nilai L kijnya minimal di antara yang lainnya. Dalam mode tanpa mencari domain terbaik, pencacahan lengkap domain dihentikan segera setelah domain ke-i dan orientasi ke-j ditemukan bahwa nilainya L kij tidak melebihi kesalahan yang diizinkan (misalnya, L kij ≤ 0,05). Dalam kedua mode, jika setelah pencacahan semua blok domain, tidak ada blok yang nilainya L kij tidak melebihi nilai kesalahan yang diizinkan yang ditentukan, maka dilakukan pemeriksaan apakah blok peringkat yang dipertimbangkan berada pada batas maksimum yang diizinkan tingkat pemisahan pangkat. Jika tidak, maka blok peringkat ini dibagi menjadi blok yang lebih kecil dan langkah algoritme ini dilakukan untuk blok tersebut. Jika ya, maka dari semua domain pilih domain tersebut dan opsi orientasinya D ij , yang nilai L kij-nya minimal di antara yang lainnya, dan pertimbangkan blok peringkat yang dipertimbangkan untuk dicakup oleh domain ini.

Langkah 3 adalah yang paling intensif secara komputasi karena untuk setiap blok peringkat Rk, algoritme menghitung semua (atau banyak, tergantung pada mode operasi) blok domain dan opsi orientasinya, melakukan operasi per piksel untuk mengubah orientasi dan menemukan koefisien transformasi, yang menghabiskan banyak waktu komputer. Kompresi yang baik bergantung pada kemampuan untuk menemukan kecocokan yang baik antara blok domain dan peringkat tanpa harus membagi blok peringkat terlalu dalam. Pemisahan peringkat yang terlalu dalam menyebabkan terlalu banyak peringkat, yang memperburuk rasio kompresi, dan tidak cukup dalam menyebabkan kualitas gambar yang disandikan menjadi buruk.

algoritma FE. Membandingkan peringkat dengan domain dalam algoritme dasar membutuhkan sumber daya komputasi yang signifikan. Untuk menguranginya dalam algoritma FE (dari Ekstraksi Fitur Bahasa Inggris - ekstraksi fitur), lima karakteristik dibedakan yang menggambarkan blok domain dan peringkat. Dan awalnya, perbandingan mereka yang dilakukan, yang secara signifikan mengurangi jumlah perhitungan. Karakteristik ini adalah sebagai berikut:

standar deviasi;
asimetri;
kontras interpiksel;
koefisien beta yang mencirikan perbedaan antara nilai piksel dan nilai piksel pusat;
gradien maksimum - maksimum gradien horizontal dan vertikal.

Algoritme itu sendiri mencakup langkah-langkah berikut.

Langkah 1. Mirip dengan langkah 1 dari algoritma dasar.

Langkah 2. Melengkapi langkah 2 dari algoritme dasar, nilai vektor karakteristik untuk setiap blok domain dihitung dan disimpan.

Langkah 3. Saat memproses blok peringkat, vektor fiturnya dihitung terlebih dahulu, kemudian jarak antara vektor fitur dari peringkat yang diberikan dan vektor fitur dari setiap domain dihitung menggunakan rumus

di mana f j R dan f j D masing-masing adalah karakteristik ke-j dari blok peringkat dan domain. Untuk perbandingan lengkap berikutnya, hanya persentase q yang ditentukan dari domain (misalnya, q = 2%) dengan nilai minimum jarak antara vektor karakteristik yang dipilih. Tindakan selanjutnya serupa dengan yang dilakukan pada langkah 3 dari algoritme dasar, tetapi dengan perbedaan bahwa saat mengulang domain, hanya q % terpilih yang dipertimbangkan dan yang terbaik dipilih darinya.

Perhatikan bahwa prosedur pemilihan domain semacam itu adalah sejenis filter yang secara signifikan membatasi jumlah mereka untuk disortir.

Deskripsi perangkat lunak yang dikembangkan

Untuk melakukan penelitian, software khusus dikembangkan dalam C# menggunakan teknologi Microsoft .NET Framework 2.0 dan tool shell Visual Studio 2005/2008. Ini memungkinkan Anda untuk menyandikan gambar raster menjadi fraktal dan mendekodekannya menggunakan algoritme yang dibahas di atas. Pengguna dapat mengatur pengaturan enkode yang mengontrol kualitas gambar yang dikodekan. Selain itu, perangkat lunak ini menyertakan alat analisis berikut:

menampilkan struktur domain dan pangkat, baik dalam bentuk tabel dengan nilai propertinya, maupun secara visual pada gambar;
menghitung kesalahan piksel rata-rata antara gambar asli dan gambar yang disandikan;
menghitung jumlah peringkat dan domain yang diproses dan digunakan dalam penyandian;
menentukan waktu encoding dan decoding;
menampilkan kotak blok peringkat pada gambar yang disandikan;
analisis otomatis dari hasil pengkodean gambar oleh algoritma kompresi fraktal yang berbeda.

Diagram UML dari perangkat lunak yang dikembangkan ditunjukkan di bawah ini (Gambar 1):

Gambar 1 - Diagram UML dari perangkat lunak yang dikembangkan

Gambar 2 — Bentuk layar dari perangkat lunak yang dikembangkan

Eksperimen, hasil dan kesimpulan

Menggunakan perangkat lunak yang dikembangkan, serangkaian percobaan dilakukan di mana gambar berukuran 256 × 256 piksel yang dipilih secara sewenang-wenang digunakan, ditunjukkan pada Gambar 3. Data awal, pengaturan, dan hasil percobaan ditunjukkan pada Tabel 1. algoritma.

Gambar 3 - Gambar asli

Gambar 4 — Visualisasi delapan iterasi decoding gambar yang dikodekan oleh algoritma kompresi gambar fraktal dasar (a) dan FE- (b). Animasi terdiri dari 9 frame dengan jeda 50ms antar frame; penundaan pemutaran ulang adalah 400ms; jumlah siklus pemutaran dibatasi hingga 10.

Dalam percobaan, waktu pengkodean pada kedua algoritma tidak dibatasi. Setiap percobaan selanjutnya berbeda dari yang sebelumnya dalam nilai parameter yang lebih tinggi yang menentukan kualitas gambar yang disandikan. Mari kita jelaskan beberapa parameter ini, yang tujuannya tidak diungkapkan secara rinci dalam deskripsi algoritme. Tingkat awal, maksimum pemisahan domain, serta koefisien geser domain, mengatur jumlah, ukuran, dan lokasinya. Faktor selip menentukan seberapa erat tumpang tindih domain yang berdekatan (misalnya, dengan nilai minimum 0, mereka tidak tumpang tindih sama sekali, dan dengan nilai maksimum 1, mereka tumpang tindih sehingga area dengan tepat satu piksel tetap tidak tumpang tindih) . Jumlah domain hanya bergantung pada parameter ini. Tingkat awal peringkat pemisahan menetapkan jumlah peringkat minimum awal dan ukuran maksimum yang mungkin, dan tingkat pemisahan maksimum menetapkan jumlah maksimum yang diizinkan dan ukuran minimum yang mungkin. Level-level ini sebenarnya adalah level pembagian peringkat menggunakan metode quad-tree. Jumlah peringkat pada akhir pengkodean tidak hanya bergantung pada parameter ini, tetapi juga pada kesalahan yang diizinkan (lihat deskripsi algoritme). Kesalahan piksel rata-rata menunjukkan seberapa besar perbedaan gambar yang dikodekan dari aslinya, dan ditentukan oleh rumus

di mana p x, y , p" x, y adalah nilai piksel pada titik (x, y) dari sumber dan gambar yang diterjemahkan, masing-masing, I W , I H masing-masing adalah lebar dan tinggi (dalam piksel) gambar, N I adalah jumlah piksel dalam gambar.

Perhatikan bahwa parameter yang menentukan jumlah domain secara langsung memengaruhi waktu pengkodean dan kualitas gambar yang didekode, dan tidak memengaruhi rasio kompresi. Parameter yang mengontrol jumlah dan ukuran peringkat mempengaruhi waktu encoding dan decoding serta kualitas gambar yang didekode. Dan jumlah peringkat secara unik menentukan rasio kompresi.

Tabel 1 - Hasil Eksperimen

Pilihan	nomor eksperimen
Pilihan
algoritma FE
Jumlah domain
kepala.ur.rumah.
maks.tingkat rumah
Coef. domain geser
Jumlah peringkat
Awal tingkat pembagian peringkat

Pemakaman yang diizinkan
Cari domain terbaik
Menikahi pix. kesalahan, %
Rasio kompresi
Waktu pengkodean, (s)
Waktu decoding, (s)
Algoritma Dasar
Jumlah domain
kepala.ur.rumah.
maks.tingkat rumah
koefisien slip rumah
Jumlah peringkat
Awal tingkat pembagian peringkat
Maks. tingkat pembagian peringkat
Pemakaman yang diizinkan
Cari domain terbaik
Menikahi pix. kesalahan, %
Rasio kompresi
Waktu pengkodean, (s)
Waktu decoding, (s)

Hasil yang diperoleh memungkinkan kami untuk menarik kesimpulan berikut:

Algoritma FE, dibandingkan dengan yang dasar, memungkinkan Anda mengompres gambar sepuluh kali lebih sedikit dengan pengaturan algoritme yang sama.
Kesalahan piksel rata-rata dari algoritma berbeda. Tergantung pada pengaturannya, perbedaannya berkisar antara 5-16%.
Sebagai hasil pengkodean dengan algoritme dasar, dalam semua kasus, rata-rata rasio kompresi 30-40% lebih tinggi tercapai.
Kualitas visual dari gambar yang didekodekan terasa lebih baik saat menggunakan algoritme FE.
Waktu decoding dari gambar yang dikodekan pada berbagai pengaturan pengkodean lebih sedikit saat menggunakan algoritme dasar di semua percobaan.

Beberapa dari mereka cukup jelas. Memang, dalam algoritme FE, alih-alih membandingkan blok gambar, vektor karakteristiknya dibandingkan, yang secara alami memengaruhi kinerja. Perbedaan antara kesalahan piksel dan rasio kompresi kemungkinan besar disebabkan oleh fakta bahwa ketika menggunakan algoritme FE, sebagai hasil pengkodean, diperoleh lebih banyak peringkat kecil, yang juga memberikan detail gambar yang lebih tinggi, yaitu kualitas visual yang lebih baik. . Kesimpulan ini dikonfirmasi oleh Gambar 6, yang menunjukkan gambar yang dikodekan oleh kedua algoritme dengan kisi peringkat. Perlu dicatat bahwa meskipun algoritme dasar menghasilkan kualitas gambar 5-16% lebih buruk, tetapi pada saat yang sama, rasio kompresi 30-40% lebih tinggi tercapai.

Dapat diasumsikan bahwa alasan perbedaan yang terungkap terletak pada kenyataan bahwa dalam algoritme FE, ketika menghitung domain yang dipilih sesuai dengan nilai karakteristiknya, tidak ada orang yang akan memberikan kesalahan yang diizinkan untuk mencocokkan peringkat. blok, akibatnya blok peringkat dibagi menjadi yang lebih kecil sesuai dengan ukuran blok. Pada saat yang sama, saat membuat kode dengan algoritme dasar untuk peringkat yang sama, sangat mungkin domain seperti itu ditemukan.

Untuk menguji hipotesis ini, modul perangkat lunak tambahan dikembangkan yang memungkinkan penghitungan jumlah kecocokan di kedua algoritme saat memilih domain, yaitu. ketika domain yang sama dipilih untuk satu peringkat di kedua algoritma. Gambarnya tetap sama. Pengaturan pengkodean sesuai dengan yang digunakan dalam percobaan keempat pada Tabel 1, dengan satu-satunya perbedaan bahwa algoritme dasar berfungsi dalam mode pencarian domain terbaik. Ini berarti bahwa saat memproses setiap blok peringkat, semua blok domain disebutkan, tanpa berhenti ketika kesalahan yang diizinkan tercapai, dan yang terbaik dipilih. Ini, menurut kami, memungkinkan kami untuk membuat perbandingan yang benar.

Sebagai hasil percobaan, ditemukan bahwa untuk 99,73% blok peringkat, algoritma FE memilih domain lain, yaitu. - bukan yang terbaik. Jadi, setidaknya untuk gambar ini, dapat dikatakan bahwa prosedur pemilihan domain yang diadopsi dalam algoritma FE tidak sepenuhnya mencerminkan kedekatan blok yang dibandingkan.

Kesimpulan

Sebagai hasil dari studi dan percobaan yang dilakukan, pertimbangan berikut mengikuti.

1. Tampaknya masuk akal bahwa efisiensi kompresi sangat bergantung pada pemisahan awal gambar asli. Memang, tidak dimasukkannya domain yang baik atau penolakannya yang salah memengaruhi tingkat kompresi dan kualitas decoding. Secara apriori, tampaknya masuk akal bahwa perbedaan antara piksel dekat yang bertetangga, secara umum, kurang mencolok daripada di area yang dipilih secara acak. Untuk alasan ini, penyertaan domain fringing pada set awalnya tampak menjanjikan.

2. Gagasan untuk memperkenalkan kumpulan kriteria yang disederhanakan untuk mengurangi jumlah perhitungan secara signifikan memang menarik, tetapi dalam kebanyakan kasus membandingkan domain dengan peringkat, kumpulan ini tidak memungkinkan kami untuk mengidentifikasi domain optimal. Artinya, himpunan ini kurang memadai untuk kriteria utama. Oleh karena itu, tampaknya tepat untuk menggunakan kriteria utama alih-alih kumpulan ini, tetapi menerapkannya pada salinan yang dikurangi dari pasangan peringkat domain yang dipertimbangkan.

3. Ada juga argumen yang mengikuti langsung dari landasan teoretis metode kompresi fraktal. Dengan demikian, dari teorema kolase, tingkat perbedaan antara penarik sistem pemetaan tekan dan gambar asli tidak sedikit ditentukan oleh karakteristik kualitatif dari pemetaan yang dihasilkan. Wajar untuk mengharapkan peningkatan mereka dalam transisi dari model linier paling sederhana, kasar, yang digunakan dalam algoritme dasar ke model nonlinier yang lebih kompleks. Dalam hal ini, upaya untuk menggunakan model tersebut tampaknya relevan.

Signifikansi praktis dari karya dan kontribusi pribadi penulis terletak pada perangkat lunak yang dikembangkan yang mengimplementasikan dua algoritme dasar dan memungkinkan analisis komparatif otomatis dari karya algoritme yang diimplementasikan pada gambar apa pun. Pada tahap pengembangan, implementasi perangkat lunak modifikasi baru dari algoritma berdasarkan temuan dan proposal yang dibuat.

Ketentuan utama dari tahapan kerja individu dilaporkan pada konferensi ilmiah dan teknis internasional III ilmuwan muda dan mahasiswa "Ilmu komputer dan teknologi komputer" (Donetsk, DonNTU, 2007), konferensi ilmiah internasional mahasiswa, pascasarjana dan muda IV ilmuwan "Pemantauan komputer dan teknologi informasi" (Donetsk, DonNTU, 2008).

Lifeng Xi, Liang Bin Zhang. Studi Kompresi Gambar Fraktal Berdasarkan Algoritma Genetika yang Disempurnakan. Jurnal Internasional Ilmu Nonlinier. Vol.3, Tidak. 2, 2007, hlm. 116-124

M. Hassaballah, M.M. Makky, Youssef B. Mahdy. Metode Kompresi Citra Fraktal Cepat Berbasis Entropi. Electronic Letters on Computer Vision and Image Analysis 5(1), 2005, hlm. 30-40

PM Kronover. Fraktal dan kekacauan dalam sistem dinamis. Dasar-dasar teori. - M.: Postmarket, 2000

Barnsley, Michael F., Sloan, Alan D., Iterated Systems, Inc. Metode dan peralatan untuk kompresi gambar dengan sistem fungsi iterasi. Paten Amerika Serikat 4941193, 10 Juli 1990

* — Saat menulis abstrak ini, tesis master belum selesai. Penyelesaian akhirnya akan dilakukan pada tanggal 1 Desember 2008. Teks dan bahan disertasi dapat diperoleh dari penulis atau pembimbingnya setelah tanggal tersebut.

Sebenarnya, aplikasi praktis dari algoritma fraktal akan dibahas dalam artikel ini. Kami tidak akan menyentuh seni fraktal, itu dijelaskan dengan cukup detail di artikel sebelumnya.

Kompresi gambar fraktal.

Aplikasi pertama dan jelas dari algoritma fraktal adalah apa yang disebut kompresi gambar fraktal. Kompresi Gambar Fraktal adalah algoritma kompresi gambar lossy berdasarkan aplikasi sistem fungsi iterasi ke gambar. (Sistem fungsi iterasi atau hanya SIF - adalah sistem fungsi dari beberapa kelas fungsi tetap yang memetakan satu set multidimensi ke yang lain.) Algoritme ini dikenal karena fakta bahwa dalam beberapa kasus memungkinkan Anda untuk mendapatkan rasio kompresi yang sangat tinggi ( contoh terbaik adalah hingga 1000 kali (untuk kualitas visual yang dapat diterima) untuk foto nyata objek alami, yang pada prinsipnya tidak tersedia untuk algoritme kompresi gambar lainnya.

Dasar dari metode pengkodean fraktal adalah deteksi daerah serupa diri dalam suatu gambar. Kemungkinan menerapkan teori sistem fungsi berulang untuk masalah kompresi gambar pertama kali dieksplorasi oleh Michael Barnsley dan Alan Sloan.

Michael Barnley.

Mereka mematenkan ide mereka pada tahun 1990 dan 1991.Pengarsipan fraktal didasarkan pada fakta bahwa dengan bantuan koefisien sistem fungsi iterasi, gambar direpresentasikan dalam bentuk yang lebih kompak. Proses ini paling jelas didemonstrasikan oleh Barnsley sendiri dalam bukunya Fractal Image Compression. Ini memperkenalkan konsep Mesin Fotokopi, terdiri dari layar tempat gambar asli ditampilkan, dan sistem lensa yang memproyeksikan gambar ke layar lain. Setiap lensa memproyeksikan sebagian dari gambar asli. Dengan mengatur lensa dan mengubah karakteristiknya, Anda dapat mengontrol gambar yang dihasilkan. Persyaratan dikenakan pada lensa: mereka harus mengurangi ukuran bagian gambar yang diproyeksikan. Selain itu, mereka dapat mengubah kecerahan fragmen dan memproyeksikan bukan lingkaran, tetapi area dengan batas acak.

Satu langkah Mesin terdiri dari membangun yang baru melalui proyeksi dari gambar aslinya. Dinyatakan bahwa pada beberapa langkah gambar akan berhenti berubah. Ini hanya akan bergantung pada lokasi dan karakteristik lensa dan tidak akan bergantung pada gambar aslinya. Gambar ini disebut titik tetap atau penarik dari SIF yang diberikan. Teorema Kolase (salah satu prinsip kompresi fraktal) menjamin bahwa hanya ada satu titik tetap untuk setiap CIF. Karena pemetaan lensa bersifat kontraktif, masing-masing lensa secara eksplisit menentukan daerah yang mirip dengan dirinya sendiri dalam gambar kita. Berkat kesamaan diri, kami mendapatkan struktur gambar yang rumit dengan perbesaran apa pun.

Yang paling terkenal adalah dua gambar yang diperoleh dengan bantuan SIF: segitiga Sierpinski dan pakis Barnsley. Yang pertama diberikan oleh tiga dan yang kedua oleh lima transformasi afin (atau, dalam terminologi kita, lensa). Setiap transformasi diatur secara harfiah dalam byte, sedangkan gambar yang dibuat dengan bantuannya dapat memakan waktu beberapa megabyte.

Pakis Barnsley (kiri) dan segitiga Sierpinski(kanan).

Menjadi jelas bagaimana pengarsipan bekerja dan mengapa itu memakan banyak waktu. Faktanya, kompresi fraktal adalah pencarian area yang mirip dengan diri sendiri dalam suatu gambar dan menentukan parameter transformasi affine untuk area tersebut.

Dalam kasus terburuk, jika algoritme pengoptimalan tidak diterapkan, perlu menghitung dan membandingkan semua kemungkinan fragmen gambar dengan ukuran berbeda. Bahkan untuk gambar kecil, dengan mempertimbangkan diskresi, kita akan mendapatkan sejumlah besar opsi untuk disortir. Bahkan penyempitan kelas transformasi yang tajam, misalnya, dengan menskalakan hanya beberapa kali, tidak akan memungkinkan kita mencapai waktu yang dapat diterima. Selain itu, kualitas gambarnya hilang. Sebagian besar penelitian di bidang kompresi fraktal sekarang ditujukan untuk mengurangi waktu pengarsipan yang diperlukan untuk mendapatkan gambar berkualitas tinggi.

Penggunaan fraktal dalam kedokteran.

Saat ini, fraktal sedang dan mungkin akan digunakan dalam pengobatan. Dengan sendirinya, tubuh manusia terdiri dari banyak struktur mirip fraktal: sistem peredaran darah, otot, bronkus, dll.

Contoh struktur mirip fraktal dalam tubuh manusia: bronkus, pembuluh darah, otot.

Oleh karena itu, para ilmuwan bertanya-tanya apakah algoritma fraktal dapat digunakan untuk mendiagnosis atau mengobati penyakit apa pun? Ternyata itu mungkin. Misalnya, teori fraktal dapat diterapkan pada analisis elektrokardiogram. Dalam beberapa tahun terakhir, di negara maju, terlepas dari kemajuan nyata dalam pengembangan laboratorium baru dan metode instrumental untuk mendiagnosis dan mengobati penyakit kardiovaskular, pertumbuhannya terus berlanjut. Periode bioritme, dan, khususnya, detak jantung, yang berlangsung sekitar satu jam, satu hari atau lebih, dapat dipelajari dengan metode tradisional histogram atau analisis spektral. Namun, penilaian kronostruktur besaran dan ritme dimensi fraktal, indeks Hurst memungkinkan untuk menilai gangguan homeostasis dan perkembangan penyakit tertentu pada tahap awal dan dengan akurasi dan konten informasi yang lebih tinggi.

Contoh kardiogram.

Selain itu, fraktal dapat digunakan (masih pada tahap percobaan yang berhasil) dalam pemrosesan gambar sinar-X medis.

Contoh rontgen.

Gambar sinar-X yang diproses menggunakan algoritme fraktal memberikan gambaran yang lebih baik dan, karenanya, diagnostik yang lebih baik !!

Bidang lain dalam kedokteran di mana fraktal dapat digunakan secara aktif adalah gastroenterologi. Hingga saat ini, dan seringkali hingga hari ini, metode pemeriksaan digunakan untuk mendiagnosis penyakit pada saluran pencernaan, yang terkait dengan kebutuhan untuk memasukkan pemeriksaan dengan berbagai ketebalan, yang tidak menyenangkan bagi pasien dan staf medis. Selain itu, teknik penelitian semacam itu secara signifikan mempersempit ruang lingkup penerapannya karena ketidakmungkinan menggunakannya pada pasien yang parah secara somatik, pada pasien pada periode pasca operasi awal, dll. Alasan inilah yang menjelaskan minat berkelanjutan dari ahli fisiologi dan dokter dalam mempelajari aktivitas evakuasi motorik lambung dan usus, serta dalam pengembangan metode baru yang memungkinkan penilaian yang memadai, tidak hanya secara kualitatif, tetapi juga secara kuantitatif. intensitas dan sifat aktivitas motorik berbagai bagian saluran pencernaan. Sebagai metode tambahan untuk mempelajari MEF, metode yang didasarkan pada pengukuran aktivitas listrik organ digunakan. Studi tentang aktivitas bioelektrik saluran pencernaan meletakkan dasar untuk penciptaan metode penelitian baru dalam kedokteran, yang disebut elektrogastroenterografi. Elektrogastroenterografi adalah metode penelitian yang memungkinkan Anda mengevaluasi aktivitas bioelektrik lambung, duodenum, dan bagian lain dari saluran pencernaan.

Contoh elektrogastroenterogram.

Ini didasarkan pada pendaftaran perubahan potensial listrik dari saluran pencernaan, yaitu pengangkatan elektrogastroenterogram (EGEG). Penerapan analisis fraktal pada sinyal bioelektrik yang diterima dari organ memungkinkan untuk secara efektif menilai fungsi motorik organ dan saluran pencernaan dan berhasil mendiagnosis berbagai penyakit.

Penting juga untuk menyebutkan penemuan ilmuwan Amerika baru-baru ini bahwa jika Anda membuat peta adhesi (adhesi (dari bahasa Latin adhaesio - menempel) dalam fisika - adhesi permukaan benda padat dan / atau cairan yang berbeda) dari permukaan sel normal dan sel kanker , maka ternyata peta-peta tersebut memiliki dimensi fraktal yang berbeda. Mungkin penemuan ini di masa depan akan membantu menemukan metode baru yang efektif untuk mendiagnosis dan mengobati kanker.

Peta adhesi permukaan kanker dan sel normal

Penerapan fraktal dalam ilmu alam.

Penerapan fraktal dalam ilmu alam sangat besar. Mendeskripsikan semuanya tidak akan cukup untuk keseluruhan buku. Karena itu, mari kita memikirkan beberapa aspek yang paling menarik.

Sangat sering fraktal digunakan dalam geologi dan geofisika. Bukan rahasia lagi bahwa pantai pulau dan benua memiliki dimensi fraktal tertentu, dengan mengetahui mana Anda dapat menghitung panjang pantai dengan sangat akurat.

Juga, analisis fraktal membantu dalam pencarian dan pengembangan endapan mineral, yang distribusinya sangat sering terjadi sesuai dengan mekanisme fraktal. Kajian tektonik patahan dan kegempaan terkadang juga dipelajari dengan menggunakan algoritma fraktal.

Geofisika menggunakan analisis fraktal dan fraktal untuk mempelajari anomali medan magnet, mempelajari perambatan gelombang dan osilasi dalam media elastis, mempelajari iklim, dan banyak hal lainnya.

Dalam fisika, fraktal digunakan lebih luas lagi. Misalnya, dalam fisika keadaan padat, algoritme fraktal memungkinkan untuk mendeskripsikan dan memprediksi secara akurat sifat-sifat benda padat, berpori, sepon, dan berbagai aerogel. Ini membantu dalam menciptakan bahan baru dengan sifat yang tidak biasa dan berguna.

Contoh benda padat adalah kristal.

Studi tentang turbulensi dalam aliran sangat cocok dengan fraktal. Aliran turbulen kacau dan karenanya sulit untuk dimodelkan secara akurat. Dan di sini transisi ke representasi fraktal membantu, yang sangat memudahkan pekerjaan para insinyur dan fisikawan, memungkinkan mereka untuk lebih memahami dinamika sistem yang kompleks. Api juga dapat dimodelkan menggunakan fraktal. Bahan berpori terwakili dengan baik dalam bentuk fraktal karena memiliki geometri yang sangat kompleks. Ini digunakan dalam ilmu perminyakan.

Pergolakan.

Penggunaan fraktal dalam telekomunikasi.

Dalam telekomunikasi, fraktal digunakan untuk membuat antena fraktal. Antena fraktal adalah kelas antena kecil elektrik (ESA) yang relatif baru, yang secara fundamental berbeda dalam geometrinya dari solusi yang diketahui. Faktanya, evolusi tradisional antena didasarkan pada geometri Euclidean, yang beroperasi dengan objek berdimensi bilangan bulat (garis, lingkaran, elips, paraboloid, dll.). Antena fraktal dengan desain yang sangat kompak memberikan kinerja broadband yang unggul dalam faktor bentuk yang kecil. Cukup kompak untuk dipasang atau disematkan di berbagai lokasi, antena fraktal digunakan untuk kendaraan laut, udara, atau perangkat pribadi.Gambar di atas adalah contoh antena fraktal.

Juga di bidang teknologi jaringan, banyak penelitian telah dilakukan yang menunjukkan kesamaan lalu lintas yang ditransmisikan melalui berbagai jaringan. Ini terutama berlaku untuk layanan pidato, audio dan video. Oleh karena itu, pengembangan dan studi sedang dilakukan tentang kemungkinan kompresi fraktal dari lalu lintas yang ditransmisikan melalui jaringan, untuk mengirimkan informasi secara lebih efisien.

Fraktal sebagai elemen visualisasi dan efek khusus.

Fraktal menarik dan mempesona dengan keindahan dan ketidakterbatasannya. Itulah sebabnya (tetapi tidak hanya) fraktal sangat sering digunakan untuk membuat berbagai macam visualisasi, instalasi video, membuat efek khusus dalam grafik komputer, dll.

Mari kita mulai dengan game. Saat ini, di banyak game (mungkin contoh Minecraft yang paling mencolok), di mana terdapat berbagai jenis lanskap alam, algoritme fraktal digunakan dengan satu atau lain cara. Cara ini terbukti cukup efektif. Faktanya adalah objek alam nyata didasarkan pada struktur fraktal. Mempertimbangkan hal ini, pemrogram mencoba membuat lanskap komputer berdasarkan algoritme fraktal. Melihat keragaman permainan saat ini, di mana Anda dapat mengamati pemandangan alam yang indah, dapat disimpulkan bahwa mereka berhasil dalam hal ini. Selain itu, sejumlah besar program untuk menghasilkan lanskap dan lanskap berdasarkan algoritme fraktal telah dibuat.

Pemodelan lanskap berdasarkan algoritma fraktal menggunakan program Fractal Landscapes.

Tangkapan layar Minecraft.

Bukan tanpa fraktal di bioskop. Padahal, di bioskop, prinsip yang sama digunakan untuk menciptakan berbagai lanskap fantastis, seperti di game. Memang, mengapa membuat pohon atau gunung baru setiap saat, menghabiskan banyak waktu di atasnya, padahal semua ini bisa dilakukan berkali-kali lebih cepat dengan bantuan program komputer yang berjalan pada algoritme fraktal. Fakta menarik: dalam film horor luar angkasa terkenal Ridley Scott "Alien" dalam episode saat tim turun ke permukaan planet, monitor di kapal mentransmisikan gambar permukaan planet dalam bentuk kisi. Sama saja, gambar ini dibuat menggunakan geometri fraktal. Geometri fraktal memungkinkan seniman VFX dengan mudah membuat objek seperti awan, asap, api, langit berbintang, dan banyak lagi.

Sekarang mari kita sedikit menyentuh topik animasi fraktal. Gambar fraktal yang dibuat di berbagai generator sangatlah indah. Apa yang bisa kita katakan tentang animasi fraktal, itu pemandangan yang sangat menakjubkan. Pertama-tama, perlu disebutkan sumber daya Domba listrik. Domba listrik adalah sumber daya yang menggunakan komputasi terdistribusi untuk membuat animasi fraktal berdasarkan algoritma nyala api fraktal (dikembangkan oleh Scott Draves). Sederhananya, perangkat lunak diinstal di komputer Anda yang menggunakan mesin Anda untuk menghitung dan membuat animasi fraktal, sekaligus mengunduh dan menampilkan animasi fraktal siap pakai dalam bentuk yang disebut wallpaper "hidup". Pada saat yang sama, wallpaper yang sama ini disimpan di komputer dalam folder tertentu dan dapat ditarik keluar dari sana, sehingga nantinya dapat digunakan untuk keperluannya sendiri, misalnya dalam pengeditan video (walaupun panjangnya video agak pendek - 5 detik). Tetapi dengan memiliki program Apophysis dan skrip untuk Apophymator, Anda dapat dengan mudah membuat animasi Anda sendiri (untungnya, ada banyak pelajaran tentang topik ini di internet) dengan durasi yang sewenang-wenang, yang utama adalah mesin Anda cukup bertenaga.

Tangkapan layar animasi domba listrik:

Spektakuler animasi fraktal juga sukses digunakan para VJ dalam set videonya. Terutama instalasi video seperti itu sering digunakan di konser artis musik elektronik. Untuk ini, yang disebut program VJing (misalnya Resolume) digunakan. Contoh animasi fractal animation dari program Resolume :

Animasi fraktal sebagai visualisasi digunakan oleh pengembang perangkat lunak yang tidak terkait langsung dengan generator fraktal. Misalnya, pemutar Winamp yang terkenal memiliki sejumlah besar visualisasi (plugin milkdrop) di mana elemen fraktal dilacak dengan jelas (misalnya, set animasi Julia). Tangkapan layar visualisasi di plugin milkdrop untuk pemutar Winamp:

Jadi, bahkan setelah melakukan ulasan singkat ini, kami dapat mengatakan dengan yakin tentang aplikasi praktis yang sangat besar dari fraktal dan algoritme fraktal saat ini. Kisaran area di mana fraktal digunakan sangat luas. Dan pastinya dalam waktu dekat, daftar area di mana fraktal akan digunakan hanya akan bertambah!!!

Anda dapat membaca artikel aslinya di majalah Compuart edisi Maret.

1. Fraktal dan sejarah metode kompresi fraktal

Pada bulan Desember 1992, tepat sebelum Natal, Microsoft merilis CD barunya, Microsoft Encarta. Sejak itu, ensiklopedia multimedia yang berisi informasi tentang binatang, bunga, pohon, dan tempat-tempat indah ini tidak meninggalkan daftar ensiklopedia terpopuler di CD. Dalam survei baru-baru ini, Encarta Microsoft kembali menempati posisi pertama, mengungguli pesaing terdekatnya, Ensiklopedia Multimedia Compton. Alasan popularitas ini terletak pada kemudahan penggunaan, kualitas artikel yang tinggi, dan yang terpenting, banyaknya bahan. Disk berisi 7 jam suara, 100 animasi, sekitar 800 peta yang dapat diperbesar, dan 7.000 foto berkualitas tinggi. Dan semua ini - dalam satu disk! Ingatlah bahwa CD biasa 650 MB tanpa kompresi dapat berisi 56 menit suara berkualitas tinggi, atau resolusi video 1 jam dengan resolusi 320x200 dalam format MPEG-1, atau 700 gambar berwarna berukuran 640x480. Untuk menampung lebih banyak informasi, diperlukan algoritma pengarsipan yang cukup efisien. Kami tidak akan memikirkan metode pengarsipan untuk video dan suara. Kami akan berbicara tentang algoritme baru yang menjanjikan - kompresi fraktal dari informasi grafik.

Konsep "fraktal" Dan "geometri fraktal" (fraktus- terdiri dari fragmen, lat.) diusulkan oleh ahli matematika B.Mandelbrot pada tahun 1975 untuk merujuk pada struktur yang tidak beraturan tetapi mirip dengan diri sendiri. Kelahiran geometri fraktal biasanya dikaitkan dengan penerbitan buku B. Mandelbrot "The Fractal Geometry of Nature" pada tahun 1977. Salah satu gagasan utama buku ini adalah bahwa dengan menggunakan geometri tradisional (yaitu, menggunakan garis dan permukaan), sangat sulit untuk merepresentasikan objek alam. Geometri fraktal mendefinisikannya dengan sangat sederhana.

Definisi fraktal yang diberikan oleh Mandelbrot adalah sebagai berikut: "Fraktal adalah struktur yang terdiri dari bagian-bagian yang dalam arti tertentu mirip dengan keseluruhan"

Salah satu sifat utama fraktal adalah kesamaan diri. Dalam kasus paling sederhana, sebagian kecil fraktal berisi informasi tentang keseluruhan fraktal. Fraktal, gambar sistem dinamis yang indah ini, sebelumnya digunakan dalam grafik komputer terutama untuk membuat gambar langit, dedaunan, gunung, rumput. Gambar objek alami yang indah dan, yang lebih penting, meniru secara otentik dapat ditentukan hanya dengan beberapa koefisien.

Ada berbagai macam fraktal. Jenis fraktal yang berpotensi paling berguna adalah fraktal berdasarkan sistem fungsi iteratif (Sistem Fungsi Iterasi - IFS). metode JIKA dalam kaitannya dengan konstruksi gambar fraktal, ditemukan oleh penikmat hebat mereka oleh Michael Barnley dan rekan-rekannya dari Institute of Technology pcs. Georgia (Institut Teknologi Georgia), didasarkan pada kemiripan diri elemen gambar dan terdiri dari pemodelan gambar dengan beberapa fragmen yang lebih kecil dari dirinya sendiri. Persamaan khusus memungkinkan Anda untuk memindahkan, memutar, dan mengubah skala area gambar; dengan demikian, area ini berfungsi sebagai blok bangunan untuk sisa gambar.

Salah satu yang paling menakjubkan (dan terkenal) JIKA-gambar adalah pakis hitam, di mana setiap daunnya sebenarnya adalah versi mini dari pakis itu sendiri (lihat gbr.). Terlepas dari kenyataan bahwa gambar itu dibuat oleh komputer menggunakan metode transformasi affine, pakis itu terlihat persis seperti aslinya. Telah dikemukakan bahwa alam, ketika mengkodekan struktur genetik tanaman dan pohon, menggunakan sesuatu yang dekat dengan metode tersebut JIKA-fraktal.

JIKA-fractals memiliki satu penggunaan yang sangat nyata dan berguna: mereka dapat digunakan untuk mengompres bitmap besar menjadi pecahan dari ukuran normalnya. Pernyataan ini mengikuti dari teorema Banach tentang transformasi kontraksi (juga dikenal sebagai Teorema Kolase) dan merupakan hasil karya seorang peneliti di Institut Teknologi pcs. Georgia Michael Barnley di daerah JIKA. Berbekal kesimpulan ini, dia keluar dari institut tersebut, mematenkan penemuannya dan mendirikan perusahaan Sistem Iterasi Dimasukkan. Dia memberi tahu dunia tentang pencapaiannya di sebuah majalah byte untuk Januari 1988. Namun, tidak ada informasi tentang solusi dari masalah invers: bagaimana menemukan transformasi affine dari gambar yang diberikan. Pada saat itu, masalah ini bahkan tidak memiliki sedikit pun solusi. Di dalam artikel Barnsley beberapa gambar fraktal realistis ditampilkan, tetapi semuanya dibuat dengan tangan.

Idealnya, saya ingin dapat menemukan sistem transformasi affine untuk gambar apa pun (IFSM), yang mereproduksi gambar dengan akurasi tertentu. Namun, solusinya agak keluar dari jalan. Siswa adalah orang pertama yang menemukannya Barnsley, Arnaud Jacquin. Metode yang diusulkan disebut Sistem Fungsi Iterasi Terpartisi (PIFS). Menurut skema ini, masing-masing bagian gambar tidak mirip dengan keseluruhan gambar, tetapi hanya bagian-bagiannya.

2. Dasar matematika dari kompresi fraktal

Metode kompresi fraktal memungkinkan Anda mengompres informasi sebanyak 10.000 kali. Semua program kompresi fraktal yang diketahui didasarkan pada algoritme Jaquin, kolaborator Barnsley, yang pada tahun 1992, saat mempertahankan tesisnya, menjelaskan algoritme praktis untuk kompresi fraktal. Keuntungan yang tidak diragukan lagi dari pekerjaan ini adalah bahwa intervensi manusia dalam proses kompresi benar-benar dihilangkan.

Pertimbangkan mekanisme kompresi data fraktal. Pengarsipan fraktal didasarkan pada fakta bahwa dengan bantuan koefisien sistem fungsi iterasi, gambar direpresentasikan dalam bentuk yang lebih kompak. Sebelum melihat proses pengarsipan, mari kita lihat bagaimana IFS membuat gambar. Sebenarnya, IFS adalah sekumpulan transformasi affine tiga dimensi yang mengubah satu gambar menjadi gambar lainnya. Titik dalam ruang tiga dimensi (koordinat x, koordinat y, kecerahan) mengalami transformasi. Proses ini paling jelas didemonstrasikan oleh Barnsley sendiri dalam bukunya Fractal Image Compression. Ini memperkenalkan konsep Mesin Fotokopi, terdiri dari layar tempat gambar asli ditampilkan, dan sistem lensa yang memproyeksikan gambar ke layar lain. Setiap lensa memproyeksikan sebagian dari gambar asli. Dengan mengatur lensa dan mengubah karakteristiknya, Anda dapat mengontrol gambar yang dihasilkan. Persyaratan dikenakan pada lensa - mereka harus mengurangi ukuran bagian gambar yang diproyeksikan. Selain itu, mereka dapat mengubah kecerahan fragmen dan memproyeksikan bukan lingkaran, tetapi area dengan batas acak. Satu langkah Mesin terdiri dari membangun yang baru melalui proyeksi dari gambar aslinya. Dinyatakan bahwa pada beberapa langkah gambar akan berhenti berubah. Ini hanya akan bergantung pada lokasi dan karakteristik lensa dan tidak akan bergantung pada gambar aslinya. Gambar ini disebut titik tetap atau penarik dari IFS yang diberikan. Teorema Kolase menjamin bahwa terdapat tepat satu titik tetap untuk setiap IFS. Karena pemetaan lensa bersifat kontraktif, masing-masing lensa secara eksplisit menentukan daerah yang mirip dengan dirinya sendiri dalam gambar kita. Berkat kesamaan diri, kami mendapatkan struktur gambar yang rumit dengan perbesaran apa pun. Yang paling terkenal adalah dua gambar yang diperoleh dengan bantuan IFS, segitiga Sierpinski dan pakis Barnsley. Setiap transformasi diatur secara harfiah dalam byte, sedangkan gambar yang dibuat dengan bantuannya dapat memakan waktu beberapa megabyte. Menjadi jelas bagaimana pengarsipan bekerja dan mengapa itu memakan banyak waktu. Faktanya, kompresi fraktal adalah pencarian area yang mirip dengan diri sendiri dalam suatu gambar dan menentukan parameter transformasi affine untuk area tersebut. Dalam kasus terburuk, jika algoritme pengoptimalan tidak diterapkan, perlu menghitung dan membandingkan semua kemungkinan fragmen gambar dengan ukuran berbeda. Bahkan untuk gambar kecil, dengan mempertimbangkan diskresi, kita akan mendapatkan sejumlah besar opsi untuk disortir. Bahkan penyempitan kelas transformasi yang tajam, misalnya, dengan menskalakan hanya beberapa kali, tidak akan memungkinkan kita mencapai waktu yang dapat diterima. Selain itu, kualitas gambarnya hilang. Sebagian besar penelitian di bidang kompresi fraktal sekarang ditujukan untuk mengurangi waktu pengarsipan yang diperlukan untuk mendapatkan gambar berkualitas tinggi.

Jadi, mari pertimbangkan pembenaran matematis untuk kemungkinan kompresi fraktal.

Ada pemetaan, di mana kumpulan semua gambar yang mungkin. W adalah gabungan dari pemetaan w Saya :

Tampilan seperti itu disebut tekan, dan pernyataan berikut ini benar untuk mereka:

Jika untuk beberapa gambar F 0 kita akan mulai berulang kali menerapkan pemetaan W sehingga

Ini adalah gambar terakhir F ditelepon penarik perhatian, atau titik tetap W. Juga diketahui bahwa jika transformasi w Saya kontraktif, maka serikat mereka W juga kontraktif.

3. Skema tipikal kompresi fraktal

Mengingat hal di atas, skema kompresi terlihat seperti ini: gambar R pecah berkeping-keping R Saya, ditelepon daerah peringkat. Selanjutnya untuk setiap area R Saya menemukan daerah D Saya dan transformasi w Saya sedemikian rupa sehingga kondisi berikut terpenuhi:

1.d Saya ukurannya lebih besar R Saya .

2.w Saya (R Saya ) memiliki bentuk, ukuran dan posisi yang sama dengan R Saya .

3. Rasio kamu transformasi w Saya harus kurang dari satu.

4. Nilainya harus sekecil mungkin.

Tiga kondisi pertama berarti pemetaan w Saya akan menjadi kompresif. Dan berdasarkan kondisi keempat, gambar yang disandikan R dan citranya W(R) akan mirip satu sama lain. Idealnya R=W(R). Dan ini berarti citra kita R dan akan menjadi titik tetap W. Di sinilah kesamaan berbagai bagian gambar digunakan (oleh karena itu namanya - "kompresi fraktal"). Ternyata, hampir semua gambar nyata mengandung bagian-bagian yang mirip satu sama lain, hingga transformasi affine.

Jadi, untuk kompresi gambar W perlu:

1. Pisahkan gambar menjadi area peringkat R Saya(area yang tidak tumpang tindih menutupi seluruh gambar).

2. Untuk setiap area peringkat R Saya menemukan daerah D Saya(ditelepon domain), dan tampilkan w Saya, dengan sifat-sifat di atas.

3. Ingat koefisien transformasi affine W, posisi wilayah domain D Saya, serta membagi gambar menjadi beberapa domain.

Karenanya, untuk mendekompresi gambar, Anda memerlukan:

1. Buat beberapa (apa saja) gambar awal R 0 .

2. Terapkan pemetaan berulang kali padanya W(Persatuan w Saya).

3. Sejak tampilan W mengompresi, kemudian sebagai hasilnya, setelah iterasi yang cukup, gambar akan sampai ke atraktor dan berhenti berubah. Penarik adalah citra asli kita. Dekompresi selesai.

Inilah yang memungkinkan Anda untuk meningkatkannya beberapa kali selama penerapan. Yang paling mengesankan adalah contoh di mana, ketika gambar objek alami diperbesar, detail baru muncul yang benar-benar melekat pada objek tersebut (misalnya, ketika sebuah batu memperoleh ketidakteraturan baru yang lebih kecil saat foto diperbesar).

4. Perkiraan rasio kompresi dan biaya komputasi

Ukuran data untuk penentuan lengkap area peringkat dihitung dengan rumus:

Di mana Nb Dan Mb- jumlah bit yang diperlukan untuk menyimpan setiap koordinat dihitung menggunakan rumus berikut:

Di mana V Dan H- dimensi gambar vertikal dan horizontal, ukuran- ukuran blok domain, melangkah- langkah pencarian area domain.

Untuk menyimpan transformasi T 3 bit diperlukan.

untuk penyimpanan AS Dan V Masing-masing membutuhkan 9 dan 7 bit.

Misalnya, ambil gambar dengan ukuran 256x256 piksel, dan kita akan menjelajahi area domain dengan langkah 4 piksel.

Nd = Md = (256 - 8 + 1) / 4 = 62

Nb=Mb=CEIL(log 2 62) = 6

Z = 12 + 3 + 6 + 6 = 27

Rasio kompresi S adalah

S = (8 * 8 * 8) / 27 = 19

Rasio kompresinya tidak setinggi yang kami inginkan, tetapi parameter kompresinya jauh dari optimal, dan rasionya dapat meningkat secara signifikan.

Mari kita perkirakan kompleksitas komputasi dari algoritma ini. Pada tahap kompresi, kita harus melalui semua area domain - 1 "024 buah, untuk masing-masing - semua area peringkat - 58" 081 buah (pada langkah 1), dan untuk masing-masing, pada gilirannya, semua 8 transformasi. Totalnya adalah 1 "024 x 58" 081 x 8 = 475 "799" 552 tindakan. Namun, operasi ini tidak sepele dan mencakup beberapa operasi matriks, yang pada gilirannya mencakup perkalian dan pembagian bilangan floating point.

Sayangnya, bahkan pada PC modern (yaitu, untuk mesin seperti itu kami ingin mengimplementasikan algoritme), akan membutuhkan waktu yang sangat lama untuk mengompres gambar berukuran hanya 256 x 256 piksel. Jelas, algoritma yang dipertimbangkan perlu dioptimalkan.

Kata kunci: jaringan saraf; kompresi gambar; pembelajaran mesin; fraktal.

anotasi

Makalah ini menyajikan metode untuk mengurangi waktu pengkodean untuk kompresi citra fraktal. Pendekatan ini menggabungkan ekstraksi fitur dengan klasifikasi domain menggunakan jaringan syaraf tiruan. Ekstraksi fitur mengurangi ruang lingkup tugas dan memungkinkan jaringan saraf untuk melatih gambar yang berbeda dari yang dikodekan. Jaringan saraf self-organizing untuk klasifikasi memperkenalkan konsep topologi cluster, dan juga menghilangkan kebutuhan untuk secara apriori menentukan satu set kelas gambar yang sesuai. Jaringan mengatur dirinya sendiri sesuai dengan sebaran ciri-ciri citra yang diperoleh dalam proses pembelajaran. Makalah ini menyajikan hasil yang menunjukkan bahwa pendekatan klasifikasi dapat mengurangi waktu pengkodean dengan dua kali lipat sambil mempertahankan akurasi komparatif dan efisiensi kompresi.

1. Perkenalan

Pengodean gambar fraktal adalah pendekatan yang menjanjikan dalam aplikasi kompresi gambar seperti situs web Internet. Namun, persyaratan waktu untuk langkah pengkodean dalam pendekatan ini telah menjadi penghalang yang membatasi penerapannya sebagai metode praktis. Proses pengkodean terdiri dari pemetaan blok domain ke dalam blok gambar peringkat. Untuk setiap blok peringkat, algoritme mencari blok domain seperti itu dan transformasi yang sesuai yang akan memberikan kesesuaian terbaik dengan blok peringkat. Klasifikasi blok domain dapat sangat mempercepat pengkodean dengan mengurangi jumlah domain yang perlu dicari. Penggunaan jaringan syaraf tiruan untuk tujuan klasifikasi domain telah dieksplorasi. Jaringan ini memberikan peningkatan atas pendekatan klasifikasi dasar dengan mendefinisikan topologi cluster kelas. Kontribusi dari pekerjaan ini adalah untuk menggabungkan klasifikasi domain dengan jaringan saraf yang mengatur sendiri bersama dengan ekstraksi fitur untuk memberikan pengkodean gambar yang lebih cepat. Satu set kecil karakteristik gambar yang mengukur kualitas tonal dan tekstur dihitung untuk setiap domain dan blok peringkat. Dengan demikian, setiap blok memiliki vektor fitur yang terkait dengannya, yang ukurannya tidak bergantung pada ukuran blok. Ekstraksi fitur bermanfaat karena dua alasan. Pertama, hasil pengurangan ukuran tugas mengurangi jumlah perhitungan yang diperlukan dalam proses pencarian domain. Kedua, karena karakteristiknya tidak bergantung pada struktur domain tertentu, dimungkinkan untuk melatih jaringan yang mengatur dirinya sendiri pada satu gambar dan menerapkan jaringan yang dihasilkan untuk klasifikasi pada gambar lain. Dengan demikian, waktu pelatihan jaringan bukan merupakan bagian dari total waktu penyandian. Pengukuran waktu penyandian gambar fraktal biasanya dinyatakan dalam bentuk waktu eksekusi pada workstation Sun atau Silicon Graphics. Pendekatan yang disajikan di sini memberikan pengukuran yang sebanding bila dilakukan pada PC Pentium 120 MHz.

2. Pengodean gambar fraktal

Pengkodean gambar fraktal didasarkan pada teori sistem fungsi iterasi (selanjutnya disingkat SIF, dari bahasa Inggris Iterated Function System - IFS). Teori CIF didasarkan pada Teorema Pemetaan Kontraksi (CMT) dari analisis klasik, yang digunakan untuk membangun citra fraktal secara iteratif. Gambar fraktal adalah titik tetap dalam ruang gambar, seperti yang dijamin oleh TOC, dan gambar ini disebut penarik SIF. Masalah invers yang diselesaikan dengan pengkodean gambar fraktal dimulai dengan mempertimbangkan gambar yang diberikan dan menghitung SIF yang mewakili gambar yang dekat dengan yang diberikan - penariknya. Kode gambar fraktal biasanya (walaupun tidak selalu) membutuhkan ruang penyimpanan yang lebih sedikit daripada gambar aslinya, yang membuat metode ini tampak seperti metode kompresi. Hasil empiris menunjukkan bahwa dalam banyak kasus metode fraktal sama bagusnya dengan JPEG, yang dianggap sebagai standar kompresi saat ini.

Kompresi gambar fraktal menggunakan jenis SIF khusus yang disebut sistem iterasi fungsi terdefinisi sepotong-sepotong (selanjutnya disingkat SICF, dari English Partitioned Iterated Function System - PIFS). SICF terdiri dari ruang metrik lengkap X , himpunan subdomain D i ⊂ X, i = 1,...,n , dan himpunan transformasi kontraksi w i ~ : D i → X, i = 1,... ,N . Kami menganggap gambar skala abu-abu sebagai fungsi dari nilai nyata f(x, y) yang didefinisikan pada domain persegi I 2 = I×I . Misalkan w i ~ (x, y) adalah transformasi affine I 2 → I 2 sehingga

asalkan w i ~ dapat dibalik dan (x,y) ∈ R i . Konstanta s saya memperluas atau mempersempit rentang nilai fungsi f dan, karena kita berbicara tentang gambar skala abu-abu, ini mengontrol kontras. Demikian pula, konstanta oi menambah atau mengurangi nilai skala abu-abu, atau mengontrol kecerahan. Transformasi wi ~ disebut komponen spasial dari transformasi wi .

Algoritma dasar dilakukan sebagai berikut. Kami membagi gambar menjadi blok peringkat persegi panjang yang tidak tumpang tindih (R i ) . Blok R i dapat memiliki ukuran yang sama, tetapi lebih sering beberapa jenis partisi dengan ukuran blok variabel digunakan, yang memungkinkan untuk mengisi bagian gambar yang berisi detail halus dengan padat dengan blok peringkat ukuran kecil. Hasil yang disajikan di sini diperoleh dengan menggunakan skema partisi quadtree yang dijelaskan dalam . Kami menutupi gambar dengan urutan blok domain, kemungkinan tumpang tindih. Domain dapat memiliki ukuran yang berbeda dan biasanya berjumlah ratusan atau ribuan. Transformasi affine (2.1) merupakan transformasi kontraksi spasial jika |det A i |

(2.3)

kecil. Untuk gambar digital, integral (2.3) diganti dengan penjumlahan piksel. Jika, setelah menemukan wi terbaik, nilai (2.3) masih lebih besar dari kesalahan yang ditentukan sebelumnya, maka skema partisi quadtree membagi peringkat menjadi empat persegi panjang yang lebih kecil, dan proses menemukan transformasi optimal diulangi untuk blok yang lebih kecil ini. Proses ini berlanjut hingga nilai (2.3) menjadi kurang dari kesalahan yang diizinkan atau hingga kedalaman maksimum quad-tree yang telah ditentukan sebelumnya tercapai. Gambar didekodekan dengan menerapkan transformasi W secara iteratif ke gambar f , di mana

W(f)(x,y) = wi (f)(x,y) untuk (x,y) ∈ R i

Jika transformasi (w i ) dipilih dengan benar, maka iterasi W 0n (f) akan mendekati citra asli untuk beberapa nilai n yang cukup. Langkah pengkodean intensif komputasi karena banyaknya domain yang perlu dicari untuk setiap blok peringkat, serta perhitungan yang dilakukan setiap kali domain dibandingkan dengan peringkat. Dalam makalah ini, pengurangan kebutuhan komputasi dari langkah pengkodean ditujukan dalam dua cara. Pertama, diperkenalkan konsep karakteristik citra yang ditentukan untuk setiap domain dan blok peringkat. Kemudian domain yang berpotensi cocok dapat dipilih berdasarkan nilai sejumlah kecil karakteristik ini daripada nilai piksel itu sendiri. Kedua, diusulkan untuk mengatur blok domain ke dalam topologi cluster melalui jaringan saraf yang mengatur sendiri. Ini semakin mengurangi waktu penyandian dengan memungkinkan jaringan untuk dengan cepat menemukan di ruang fitur blok domain yang mirip dengan blok peringkat.

3. Menyoroti karakteristik

Salah satu cara untuk mempercepat proses pengkodean citra fraktal adalah dengan mengekstrak sejumlah kecil karakteristik yang menggambarkan blok domain dan peringkat. Kemudian perbandingan blok domain dan peringkat dilakukan berdasarkan karakteristik ini, dan bukan pada piksel individual, yang mengurangi jumlah pekerjaan. Dalam tulisan ini, enam karakteristik yang digunakan menggambarkan distribusi tekstur dan kontras gambar. Ekstraksi fitur itu sendiri memberikan percepatan yang signifikan dari proses pengkodean.

Enam karakteristik berikut digunakan di sini: 1) standar deviasi, σ; 2) asimetri (kemiringan), yaitu jumlah kubus dari perbedaan antara nilai piksel dan nilai rata-rata blok, dinormalisasi oleh kubus σ; 3) kontras interpiksel (kontras tetangga), yang mengukur perbedaan antara nilai piksel tetangga; 4) beta (beta), yang menunjukkan seberapa besar perbedaan nilai piksel dengan nilai di tengah blok; 5) gradien horizontal (horizontal gradient), yang mencirikan perubahan nilai piksel blok secara horizontal; 6) gradien vertikal, yang mencirikan perubahan nilai piksel blok dari atas ke bawah. Nilai piksel rata-rata tidak digunakan sebagai karakteristik, karena kontras dan kecerahan berubah selama proses pencocokan blok domain dan peringkat. Saat membandingkan jarak dalam ruang fitur, vektor fitur dinormalisasi sehingga nilai fitur terbesar tidak mendominasi perbandingan.

4. Jaringan saraf yang mengatur sendiri

Perbaikan selanjutnya yang dapat dilakukan adalah mengklasifikasikan domain dan rank berdasarkan karakteristik tersebut dan membandingkan rank hanya dengan domain kelas sejenis. Skema klasifikasi domain yang digunakan di sini didasarkan pada jaringan syaraf tiruan Kohonen. Jenis jaringan ini terdiri dari kisi-kisi posisi simpul. Sebuah vektor bobot dikaitkan dengan setiap simpul kisi, yang memiliki dimensi yang sama dengan dimensi vektor fitur. Dimensi vektor fitur yang digunakan disini adalah 6. Dan grid node yang digunakan disini terdiri dari 10 baris dan 10 kolom. Setiap node mewakili kelas blok domain gambar, jadi kami bertujuan untuk menjaga agar jumlah total node cukup kecil. Cara lain untuk mengatur simpul dapat dipertimbangkan, seperti matriks berdimensi lebih tinggi.

Proses pembelajaran terjadi secara mandiri, tanpa kendali manusia. Jaringan vektor bobot diinisialisasi dengan nilai acak. Kemudian vektor fitur input dimasukkan ke dalam jaringan, dan kami mencari vektor bobot yang paling dekat dengan vektor input. Artinya, kami menemukan i'j' sedemikian rupa

||v – w i’j’ || ≤ ||v – w ij || untuk semua i, j

di mana v adalah vektor fitur masukan dan w adalah vektor bobot pada simpul ij. Bobot yang berdekatan dalam kisi dengan bobot yang dipilih w i'j' diadaptasi agar lebih menyerupai vektor masukan. Adaptasi ini diungkapkan oleh rumus

w ij baru = w ij lama + ε exp(α ||v–w ij lama || 2) (v– w ij lama)

di mana ij adalah indeks dari node yang berada di sekitar node i'j' . Ukuran lingkungan ini berkurang dengan setiap iterasi baru dari proses pembelajaran. Parameter ε adalah langkah iterasi, dan α berbanding terbalik dengan langkah ini. Implementasi perangkat lunak dari hasil yang disajikan diberikan dalam .

Setelah jaringan dilatih, blok domain untuk gambar tertentu diklasifikasikan dengan menetapkan masing-masing vektor bobot yang paling dekat dengannya dalam ruang fitur. Ketika vektor fitur dari blok peringkat memasuki jaringan, ia juga diberi vektor bobot jaringan. Kemudian blok peringkat dibandingkan dengan domain yang berasosiasi dengan vektor bobot yang diberikan, serta dengan domain yang berasosiasi dengan vektor bobot yang berdekatan pada kisi jaringan. Keuntungan klasifikasi berdasarkan jaringan saraf yang mengatur sendiri terletak pada gagasan untuk mengatur kelas gambar menjadi kelas tetangga, yang disediakan oleh kisi jaringan. Keuntungan lain adalah bahwa pengelompokan jenis gambar seperti itu terjadi tanpa perlu menentukan kelas gambar terlebih dahulu.

5. Hasil

Tabel 1 menyajikan hasil perbandingan kompresi citra fraktal menggunakan tiga metode berbeda, diterapkan pada citra yang ditunjukkan pada Gambar 1 dan 2. Metode “basis” adalah metode partisi quad-tree standar yang dibahas dalam , tanpa klasifikasi domain . Nilai "quadtree level" menunjukkan kedalaman maksimum yang diperbolehkan dari quad-tree. Di sini, sejumlah besar menyebabkan blok peringkat yang lebih kecil, yang menghasilkan kualitas gambar yang didekodekan lebih baik, tetapi pada saat yang sama menyebabkan kompresi yang lebih buruk. "Error threshold" adalah parameter yang mengontrol kondisi untuk membagi blok berperingkat menjadi blok yang lebih kecil dari tingkat quad-tree berikutnya yang lebih tinggi. Nilai kesalahan dihitung dengan membandingkan bitmap asli dengan gambar yang didekode menggunakan 6 iterasi (lebih banyak iterasi akan memberikan kesalahan yang sedikit lebih kecil). "Kesalahan rata-rata, %" ("kesalahan rata-rata") adalah kesalahan rata-rata per piksel, sedangkan "PSNR" adalah rasio sinyal-terhadap-derau puncak, dihitung seperti dalam . Metode fitur-saja fitur membandingkan blok domain dan peringkat di enam fitur yang dibahas dalam Bagian 3. Metode fitur-saja (SO) terakhir mengklasifikasikan domain menggunakan jaringan syaraf tiruan dengan ekstraksi fitur seperti yang dibahas di atas. Dalam setiap kasus, total 320 blok domain digunakan. Semakin banyak domain akan menghasilkan waktu penyandian yang lebih lama dan rasio kompresi yang lebih baik.

Rasio kompresi diperkirakan dengan rasio rata-rata 4 byte untuk setiap blok peringkat dengan 66614 byte bitmap asli. Metode SO kira-kira dua kali lebih cepat dari metode FO dan seratus kali lebih cepat dari metode dasar ("waktu per blok" menyatakan ukuran waktu eksekusi yang tidak bergantung pada kesetiaan gambar akhir; waktu yang diberikan di sini adalah untuk Pentium Komputer 120MHz). Jaringan pengorganisasian mandiri dilatih secara terpisah pada gambar yang berbeda dari dua gambar yang disajikan di sini, sehingga waktu pelatihan tidak termasuk dalam total waktu untuk metode ini. Rasio kompresi dan kualitas gambar yang didekodekan, baik dengan metode akselerasi maupun dengan metode dasar, sepadan.

Tabel 1 - Hasil kompresi citra fraktal menggunakan klasifikasi domain self-organizing metode ("SO"), perbandingan domain berdasarkan karakteristik saja ("FO"), dan metode dasar ("Base")

	Gambar	Ambang batas kesalahan	Tingkat pohon segi empat	Jumlah blok	Waktu)	Waktu per blok, (s)	Kesalahan rata-rata, %		Coef. kompresi







(A)	(B)

Gambar 2 - (a): Bitmap asli "Daun" (256×256, 256 skala abu-abu); (b): Gambar yang didekodekan (6 iterasi, quadtree level 7, kesalahan piksel rata-rata 3,05%, kompresi 1,6:1). Tingkat detail yang lebih tinggi pada gambar ini menghasilkan kinerja yang lebih lambat

6. Kesimpulan

Kombinasi ekstraksi fitur dengan klasifikasi domain oleh jaringan saraf yang mengatur sendiri memberikan percepatan pengkodean yang signifikan. Mengklasifikasikan gambar berdasarkan sejumlah kecil fitur tidak hanya mengurangi jumlah perhitungan, tetapi juga memungkinkan jaringan dilatih pada gambar selain yang dikodekan, sehingga menghilangkan waktu pelatihan dari total waktu pengkodean. Jaringan yang mengatur dirinya sendiri menetapkan kumpulan kelas domain perwakilannya sendiri dan juga menentukan topologi cluster dari kelas domain.

literatur

E. DeJesus, “Walking, Talking Web”, Byte, Januari 1997, 81-84.
Y. Fisher, ed., Kompresi Gambar Fraktal, (New York: Springer-Verlag, 1995).
A. Jacquin, "Pengodean gambar berdasarkan teori fraktal dari transformasi gambar kontraktif berulang", IEEE Trans. GambarProc. 1, 1992, 18-30.
A. Bogdan dan H. Meadows, "Jaringan saraf Kohonen untuk pengkodean gambar berdasarkan teori transformasi iterasi", Proc. SPIE 1766, 1992, 425-436.
R. Hamzaoui, “Codebook clustering by self-organizing maps for fractal image compression”, NATO ASI Conf. Pada Pengkodean dan Analisis Gambar Fraktal, Juli 1995.
M. Barnsley, Fraktal Di Mana Saja, edisi ke-2. (Boston: Academic Press, 1993).
T. Kohonen, Pengorganisasian Diri dan Memori Asosiatif, (Springer-Verlag, 1989).
S. Welstead, Neural Network and Fuzzy Logic Applications in C/C++, (New York: John Wiley and Sons, 1994).

Dengan kuantisasi vektor, sekelompok sampel N dari sinyal digital secara bersamaan dikodekan ( N- vektor dimensi). Dalam kasus sinyal satu dimensi, vektor dapat berupa kumpulan dari N pembacaan berturut-turut. Dalam kasus gambar, vektor dapat berupa blok dari beberapa elemen gambar yang berdekatan secara horizontal dan vertikal. Pada ara. 5.54 adalah diagram blok dari sistem transmisi informasi yang menggunakan kuantisasi vektor.

Arti dari kuantisasi vektor adalah sebagai berikut. Himpunan semua yang terjadi dalam sinyal N vektor -dimensi dibagi menjadi L himpunan bagian sehingga vektor yang termasuk dalam setiap himpunan bagian sedikit berbeda satu sama lain. Di setiap subset, satu vektor referensi dipilih yang mewakili semua vektor dari subset ini. Semua vektor referensi dicatat dalam buku kode dan masing-masing diberi kata kode tertentu.

Masukan sinyal digital x(n) adalah input ke encoder. Prosedur pengkodean adalah bahwa untuk setiap vektor N-dimensi dalam buku kode adalah vektor referensi yang paling dekat dengannya, kode yang diumpankan ke keluaran pembuat enkode. Jadi, untuk setiap kelompok N- sampel sinyal masukan x(n) satu kata kode ditransmisikan kamu(k).

Di decoder, sesuai dengan kata kode yang diterima kamu(k)(tanda hubung menunjukkan bahwa sinyal berasal dari saluran komunikasi) vektor referensi dibaca dari buku kode, diubah menjadi grup N sampel keluaran y(n). Buku kode dapat bervariasi tergantung pada sifat sinyal yang akan dikodekan.

Kuantisasi vektor adalah metode kompresi lossy, dan sejak grup nyata dari N sampel sinyal masukan X(n) dalam sinyal keluaran y(n) diganti dengan referensi N- vektor dimensi. Salah satu keuntungan kuantisasi vektor adalah kesederhanaan dekoder, di mana hanya operasi pembacaan vektor referensi dari buku kode yang dilakukan.

Pada saat yang sama, pencarian di pembuat enkode untuk vektor referensi yang paling dekat dengan vektor yang sedang dikodekan membutuhkan banyak perhitungan. Vektor referensi terdekat dibaca dari buku kode ketika nilai minimum kesalahan kuantisasi kuadrat tercapai e :

E= S (aj-bj) 2 ,

Di mana a j- elemen vektor input; bj adalah elemen dari vektor referensi.

Dekat dengan kuantisasi vektor adalah pengkodean gambar fraktal, di mana blok yang dipotong dari gambar asli itu sendiri digunakan sebagai elemen buku kode.

Metode kompresi fraktal dapat dianggap sebagai modifikasi kuantisasi vektor, di mana blok yang dipotong dengan berbagai cara dari gambar asli itu sendiri digunakan sebagai elemen buku kode. Diijinkan untuk mengubah blok gambar yang disandikan, yang memungkinkan untuk mencapai kesamaan blok ini dengan blok referensi (rotasi, pantulan cermin). Kuantisasi vektor dan pengkodean fraktal dapat digunakan di televisi, memberikan kompresi informasi yang signifikan.

Namun, banyaknya perhitungan yang terlibat dalam pengkodean mencegah teknik ini diterapkan pada sistem televisi digital.

Kontrol pertanyaan

1. Dalam urutan apa blok gambar berwarna dikodekan menurut standar JPEG?

2. Mengapa kuantisasi koefisien DCT menciptakan distorsi yang kurang terlihat dibandingkan kuantisasi gambar itu sendiri?

3. Bagaimana standar JPEG mengontrol jumlah kompresi?

4. Apa inti dari pengkodean dengan panjang kata kode yang bervariasi?

5. Apa arti istilah "pengkodean hibrid" sehubungan dengan standar MPEG-1, MPEG-2?

6. Mengapa pertukaran bingkai GOP dilakukan sebelum penyandian MPEG-1, MPEG-2?

7. Apa perbedaan antara mode pengkodean bingkai dan bidang dalam MPEG-1, MPEG-2?

8. Mengapa untuk B- Bingkai mencapai rasio kompresi tertinggi?

9. Apa tujuan dari buffer memori dalam encoder MPEG-2?

10. Apa itu skalabilitas?

11. Apa itu level dan profil MPEG-2?

12. Bagaimana data program TV yang berbeda diekstraksi dari aliran transport MPEG-2?

Kategori

Pilihan Editor