BWT for Move to Front + Frequency Count
圧縮の前処理であるBWTの後処理で更に圧縮しやすくする手法を紹介します。 有名なのはMove to Frontです。それだけでも記号頻度が小さい値に偏りまくりますが、頻度表(Frequency ...
166 search resultsShowing 1~20 results
You need to log-in
圧縮の前処理であるBWTの後処理で更に圧縮しやすくする手法を紹介します。 有名なのはMove to Frontです。それだけでも記号頻度が小さい値に偏りまくりますが、頻度表(Frequency ...
extends連打 class A extends class extends class{}{}{} 駄目な書き方 class A extends class{} extends class{...
BWTと文脈混合法、どちらも高圧縮な手法として有名です。それらをうまく組み合わせると、当然スンバラスィー性能になります。 その代表格としてbcmを紹介します。高速高圧縮、ついでに単純設計で移植も...
LZP改良講座第2話をお送りします。前回は最長一致系列を複数のhash表から選定するという小細工を披露しました。今回はlinked listを辿ってお気に入りの最長一致系列を求めちゃいます。 L...
RangeCoder(桁上がり無し版)を少ない文字数で実装しようという魂胆丸見えの企画です。終了判定は記号256で行います。 頻度表上限検査無 関数fが圧縮と展開を担います。Aは数値配列(要素は...
逆走MTFとは配列の値を小さい値に偏らせるMove to frontの逆走版です。つまり最後尾から先頭に向かって走査します。そんな事して良い事あるのかって? 勿論あります。MTFより小さい値が増...
今更こんな事説明するまでもないかもしれませんがガガ…、その理由らしキモノを書き散らかしやがっておきマス。 CodePenでは書いたprogramがそのまま実行されるわけではありません。いちいち書...
関数のprototypeに文字列のようなものを放り込んでおくと、instance生成時にあたかも最初から文字列が格納されているかのように振る舞う。 let f=function(){}; f.p...
HTML要素を取得しようとすると拒否される事があります。問題は取得方法の方です。以下のようなHTMLがあるとします。 <a class="" id="" name="">link&l...
手抜きzip/gzip fileを作っている人必見、とてつもなく丁寧に圧縮して、互換性のあるfileをヒネリ出すprogramを紹介していくぞ…。 7zip 言わずと知れた高圧縮書庫製造機。zi...
Data圧縮の前処理として、Dataの「種類が変わる境界」を統計的に検出する方法を紹介します。entropy(情報量)、文脈の統計等を計算する事により、ぼちぼちええ感じに圧縮区間を分割する事が可...
SACA-Kとは線形時間で接尾辞配列を構築するprogramです。しかし最新のsaisほど高速ではないし、使い勝手も悪いという有り様…。今更こんな骨董品紹介せんでも…。 どこが使いにくいかと言う...
Move to front(MTF)以上に記号を小さい値に偏らせるよう考案されたのがSorted Rank Coding(SRC)です(知名度は低い)。 入力文字列 That that is i...
console上でいわゆるUncaught RangeError: Maximum call stack size exceededなどと宣言されちゃう処理を検証。 deep clone そんな...
過去記事の改良版もどきを紹介。過去版より大量の記憶空間を消費して圧縮率向上を目論むそうです。と言っても微々たるものですが…。 原理 今回は3文字によるhash表(TypedArray)に加え、4...
Word eXtraction method、いわゆる文法圧縮の一種。開発者はOkanohara氏。20年以上前の化石programですが、面白いので紹介します。 概要 WX法は、Dataを最小...
iframeのsrc属性値次第でSecurityErrorが発生する場合としない場合があります。contentWindow.documentを書き替えようと目論むも、以下に示すいずれかのifra...
GRZipII編第2話。 原理 BlockSort -> WFC -> RLE -> Range符号 という流れで圧縮。MTFより強力なWeighted Frequency C...
下準備 <img src="data:image/...">という構成の最短記述を検証してみました。dataURI形式限定で、外部画像fileを読み込むのは禁止です。 1画素の画像を...
LZPは辞書式圧縮の一種で「直前の文脈を使って次のbyte列を予測し、予測が当たった場合は一致長だけを出力する」という方式です。LZ77の変種に近いですが、位置を出力しない点が特徴です。 本題 ...
166 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.