huffman符号+文脈混合法
適応型huffman符号もどきを利用した高圧縮programを紹介します。純粋な統計型手法であり、速度は全く褒められたものではありません。圧縮性能はgzipに匹敵しまくるとかしないとか…。 手口...
156 search resultsShowing 1~20 results
You need to log-in
適応型huffman符号もどきを利用した高圧縮programを紹介します。純粋な統計型手法であり、速度は全く褒められたものではありません。圧縮性能はgzipに匹敵しまくるとかしないとか…。 手口...
性懲りも無くまた始まってしまいました。超小型圧縮展開programの紹介です。今回は文脈混合法(context mixing)とかいう技法を使います。 ざっくり説明すると、直前の1~8文字分と一...
何の変哲もない、gzip以上の圧縮力しか持たない程度のprogramを紹介します。その正体はscript、body、iframe、svgいずれか単独要素のみからなるのhtmlです。いささか無作法...
JavaScriptのtypeofによる型判定ではいちいち全文字比較するのが定番となっている。例えば if(typeof a==="undefined"); などといった具合だ。しかしこれはかな...
たかが562 bytesですが圧縮率は概ねgzipを超えるという代物です。圧縮原理はBlock sorting(BWT) + Move to front + 2値Range coderとなります...
BWT+MTF+RCの改良版です。MTFにより大量発生した0を連長圧縮させます。そうする事で圧縮率が向上します。 program自体もできる限り小さくなるように設計します。現状では圧縮と展開の関...
今回は遥か昔に失われた化石programを紹介します。これはかつてDO++というweb siteで公開されていたもので、最新版は2004/11/28です。 時は流れ2010年代初頭にsite消滅...
またつまらぬものを記ってしまったかどうかは定かではないかもしれませんが、browserで組み込み圧縮伸長関数が実装されているので紹介します。その実態はdeflateとその包括形式であるgzipと...
今更こんな事説明するまでもないかもしれませんがガガ…、その理由らしキモノを書き散らかしやがっておきマス。 CodePenでは書いたprogramがそのまま実行されるわけではありません。いちいち書...
RangeCoder(桁上がり無し版)を少ない文字数で実装しようという魂胆丸見えの企画です。終了判定は記号256で行います。 頻度表上限検査無 関数fが圧縮と展開を担います。Aは数値配列(要素は...
逆走MTFとは配列の値を小さい値に偏らせるMove to frontの逆走版です。つまり最後尾から先頭に向かって走査します。そんな事して良い事あるのかって? 勿論あります。MTFより小さい値が増...
手抜きzip/gzip fileを作っている人必見、とてつもなく丁寧に圧縮して、互換性のあるfileをヒネリ出すprogramを紹介していくぞ…。 7zip 言わずと知れた高圧縮書庫製造機。zi...
乱数列圧縮法の一種を紹介します。これは乱数列に重複値が無い事が前提条件です。そして乱数の範囲は0~255です。そのため用途は限定的になります。 圧縮率は良くて163/256程度になります。と言っ...
出現頻度の統計を1回しかとらないByte Pair Encodingを紹介します。原理上高速ですが圧縮率はいまいち。圧縮区間は可変長です(良い圧縮率になりそうな幅を自動計算)。固定長の方が遥かに...
Shift JIS形式で文字列を盛大に圧縮するprogramを紹介します。とても日本語贔屓の設計です。htmlなりjsなり好き放題圧縮するような活用法があるとかないとか。 半角カタカナ等を使い込...
block sort(burrows wheeler transform, BWT)を利用した圧縮programを紹介します。ロードバイク並の加速力で、gzipを遥かに超える程度の圧縮力を誇るか...
今回は前回のtiny codecとやらを高速化する手口を紹介します。その犯行の手口とはhash chainで検索の初手や次手をばんばんすっ飛ばしていくというもの(LZ77でお馴染みの高速化)。 ...
SACA-Kとは線形時間で接尾辞配列を構築するprogramです。しかし最新のsaisほど高速ではないし、使い勝手も悪いという有り様…。今更こんな骨董品紹介せんでも…。 どこが使いにくいかと言う...
以前に紹介したALZ_JAを元にした圧縮programを紹介します。ALZ_JAの圧縮原理はLZ77ですが、LZW風に書き換えたものとなります。Unicodeの変換原理は同等、出力文字も同様に半...
今更ですがShift JIS符号化と復号program晒しておきます。もっとも…復号に関してはTextDecoder使えばいい話ですが、自前実装。 大昔は御丁寧にJIS漢字1万文字以上をjs f...
156 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.