Inferensi codepage berbasis entitas HTML

HEBCI adalah teknik yang memungkinkan handler formulir web untuk mendeteksi karakter secara transparan dengan yang dikodekan datanya.
Unduh sekarang

Inferensi codepage berbasis entitas HTML Peringkat & Ringkasan

Iklan

  • Rating:
  • Lisensi:
  • GPL
  • Harga:
  • FREE
  • Nama Penerbit:
  • Josh Myer
  • Situs web penerbit:
  • http://www.joshisanerd.com/ruby_index/

Inferensi codepage berbasis entitas HTML Tag


Inferensi codepage berbasis entitas HTML Keterangan

HUBCI adalah teknik yang memungkinkan handler formulir web untuk mendeteksi karakter secara transparan dengan yang dikodekan datanya. HEBCI adalah teknik yang memungkinkan handler formulir web untuk secara transparan mendeteksi karakter mengatur datanya dikodekan dengan. Dengan menggunakan referensi karakter yang dipilih dengan hati-hati, pengkodean browser dapat disimpulkan. Ini, dimungkinkan untuk menjamin bahwa data dalam pengkodean standar tanpa mengandalkan interaksi pengkodean server / browser yang sering tidak dapat diandalkan). Solusi ideal akan sepenuhnya browser- netral dan pasif. Sayangnya, spek HTML tidak menentukan mekanisme apa pun untuk ini. Kita perlu menemukan beberapa lainnya, Snearing, cara mengekstrak pengkodean karakter saat ini dari browser. Lucky untuk kita, ada trik yang bisa kita gunakan untuk ini: Kode Entitas. Kode entitas seperti string, yang digunakan untuk mengkodekan karakter tertentu tanpa menggunakan Unicode. Ketika browser menampilkan halaman, ia menggantikan ini dengan karakter yang sesuai dari pengkodean saat ini. Ini, dan menjadi karakter 0x26 di sebagian besar codePages. Dengan sendirinya, ini hanya implementasi trivia. Namun, proses terjemahan ini terjadi setiap kali pengguna mengirimkan formulir. Artinya, browser mem--parsing entitas apa pun dalam variabel formulir dan menggantinya dengan representasi pengkodean saat ini dari karakter tersebut ketika pengguna mengklik kirimkan. Dengan demikian, kode entitas apa pun dalam bidang formulir disahkan sebagai nilai karakter dalam encoding arus browser. Jadi, yang harus kita lakukan adalah menemukan entitas yang dikodekan secara berbeda dalam dua citepages berbeda. Kami tergelincir ke bidang formulir, dan kemudian melihat nilainya ketika kita mendapatkan data. Ini memungkinkan kita untuk membedakan antara kedua encoding. Bahkan, kita bisa melihat semua entitas di banyak citepages, dan menemukan orang-orang yang memungkinkan kita untuk melepaskan antara banyak citepages. Ini adalah apa yang telah saya lakukan. Kami menambahkan elemen bentuk tersembunyi dengan nilai yang berisi berbagai kode entitas, seperti °, ÷, dan -. Kemudian, ketika pengguna mengirimkan formulir, kami mengambil masing-masing dan membandingkannya dengan daftar karakter apa yang memiliki nilai apa dalam kode apa. Artinya, setiap codepage memiliki sidik jari yang unik untuk nilai °, ÷, -. Bagi MacRoman, ini A1, D6, D1; Untuk UTF-8, C2B0, C3B7, E28094. Dengan demikian, kita hanya harus melalui tabel pemetaan codepage-ke-sidik jari kita, dan melihat kecocokan sidik jari yang mana, setelah tabel ini ditemukan, biaya sidik jari yang diberikan penyerahan formulir sangat rendah. Dan, dalam kasus misses, Anda dapat mengasumsikan apa pun codepage default halaman Anda. Kasing fallthrough ini setara dengan apa yang akan dilakukan kode sebelum menambahkan lapisan deteksi ini.


Inferensi codepage berbasis entitas HTML Perangkat Lunak Terkait

Betterawstats.

Betterawstats dibuat untuk memberikan statistik yang lebih baik dari data yang disediakan oleh AWSTATS. ...

154

Unduh