パーサジェネレータ
パーサジェネレータ(英: parser generator)は、構文解析器を作成するプログラムである。
目次
1 概要
2 歴史
3 近年の発展
3.1 パーサコンビネータ
3.2 Packrat Parser
4 実装
5 参照
6 参考文献
概要
プログラミング言語のコンパイラの開発には技術と手間とを要する。それを支援するために、言語の構文などの定義から、コンパイラを生成するコンパイラジェネレータ(コンパイラコンパイラとも)が研究された。その過程で、入力を処理する構文解析器を自動生成するプログラムが開発され、広く実用に供されるようになった。これがパーサジェネレータである。
歴史
伝統的には1970年代から開発されている yacc が有名である。名前は「Yet Another コンパイラコンパイラ」の略だが、実際はパーサジェネレータである。yaccの上位互換のものとしてGNUプロジェクトのbisonがある。
近年の発展
パーサコンビネータ
パーサは入力を引数に取って解析結果を返す関数とみなすことができる。プログラミング言語に関数を組み合わせたりする能力(高階関数)があれば、演算子(コンビネータ)によりパーサを組み上げることができる。Parsecなどのパーサコンビネータライブラリが実装・公開され、使われている。
Packrat Parser
詳細は「パックラット構文解析」を参照
曖昧性の無い文法の解析のために、文脈自由文法の代わりとして使えるものとして、Parsing Expression Grammarの研究がすすんでいる。PEGの実用的なパーサとして提案されているものにPackrat Parserがあり、Packrat Parserを生成するパーサジェネレータが実装・公開され、使われている。
実装
LL法
ANTLR[1](前身は PCCTS)
JavaCC[2]
Coco/R[3]
Boost.Spirit - LL(∞)構文解析器生成フレームワークであり、文法は C++ のプログラム内にインラインで書かれる。Boostライブラリに含まれている。
JetPAG - 最適化 LL(k)構文解析器生成ツール
JFLAP - LL(1)構文解析の教育用ツール- Ocaml Genlex Module
Parsec - Haskell 向けのパーサーコンビネータのライブラリ- Scala Standard Parser Combinator Library
- SLK
LR法
- bison
- yacc
SableCC[4]
lemon - C用のプッシュ型パーサを生成
caper - C++/JavaScript/C#/D用のプッシュ型パーサーを生成
kp19pp - caperを引き継ぎ、高速化と曖昧さ・衝突の回避の改良を行ったもの
kmyacc - 多言語対応LALRパーサー生成系
CUP - LALR Parser Generator in Java
JS/CC - The LALR(1) parser and lexical analyzer generator for JavaScript, written in JavaScript
RACC - Rubyで書かれたパーサジェネレータ
PEG
XPEG - C++用
Peggy - Haskell用
PackCC - C 用 Packrat Parser 生成器 (左再帰サポート)
参照
^ ANTLR
^ JavaCC
^ Coco/R
^ SableCC
参考文献
- P.レッヒェンベルク、H.メッセンベック共著、玉井浩 訳『マイクロコンピュータのための「コンパイラ・コンパイラ」―コンパイラ自動生成にむけて』〈Information & Computing 52〉サイエンス社1991年 ISBN 978-4-7819-0607-2