2015-04-09

型パラメータAを含むSeq[A]をtoArrayするときには実行時型が必要

Scala

昨日のScalaハマリポイント：型パラメータAを含むSeq[A]をtoArrayするときには実行時型が必要

例えば、次のようなSchoolクラスがあったとする。

gist.github.com

このクラスはStudentもしくはその子クラスのコレクションをメンバに持っている。このクラス設計が嬉しいのは、コレクションの要素型がパラメータになっているおかげで、もし全ての生徒が男子であればstudentsはSeq[Boy]となり、このように作られたboysSchoolに対してはBoyだけがもつメンバfightingInstinctにアクセスできることだ。

ただし、このようなクラス設計をした時にちょっとハマってしまうのが、 Schoolクラスの内部でSeq[T]をArrayに変換しようとしたときに、以下のようにコンパイラに怒られることだ。

Error: No ClassTag available for T
  def studentsAsArray = students.toArray
                                 ^
Error: not enough arguments for method toArray: (implicit evidence$1: scala.reflect.ClassTag[T])Array[T].
Unspecified value parameter evidence$1.
  def studentsAsArray = students.toArray
                                 ^

一方で、ShoolTestでboysSchool.students.toArrayとするぶんには問題ない。このような現象に初めて出会うと、何のことだかさっぱりだ。

何故このようなことが起こるのかというと、ScalaのArrayは実際のところJavaのArrayであり、 JavaのArrayはプリミティブ型に対して最適化された個別のクラスを用意していて、それ以外の参照型に対するArrayとクラスが違うからである。つまり、Arrayを作るときにこれらのクラスを作り分けるために型Tがプリミティブ型か参照型かを知る必要があるわけだが、コンパイル時の型消去のために、Schoolクラスの内部ではTが参照型（[T <: School]）であることを知ることができない。そのため、一体どのArrayを作ればいいかわからない状態に陥ってしまう。

この問題を回避するために、JavaやScalaには実行時に型情報を取得する実行時リフレクションという機構がある。 Scala 2.11では、ClassTag というオブジェクトを使ってコンパイル時に消去されるクラス型を保持しておき、実行時に取得することができる。

上記の問題の場合、以下のように書くことでTのクラス型を保持し、実行時に知ることができるため、無事参照型のArrayを作ることできるということになる。

gist.github.com

ClassTagの詳細については、ClassTagトレイトのソースコードも参考になる。

参考：

<a href="http://stackoverflow.com/questions/4850976/why-is-classmanifest-needed-with-array-but-not-list">Why is ClassManifest needed with Array but not List?</a>stackoverflow.com
<a href="https://github.com/scala/scala/blob/2.11.x/src/library/scala/reflect/ClassTag.scala">scala/scala</a>github.com

2015-04-06

ScalaのSeqやMapは関数である

Scala

Arrayに関数オブジェクトを突っ込んでいるときに、「Arrayだって数学的には写像なんだから、Array[A => B]をInt => A => B だとみなせないのかな？」と思っていたら、ScalaのSeqがPertialFunctionトレイトを継承していることを発見。ちゃんと実現されていた。

つまり、こういうことができる。

gist.github.com

そもそも、Arrayの中に関数オブジェクトを入れたものに対して添字アクセスしていても、見た目はカリー化された関数と変わらない。こういうのを見ると、Scalaの添字アクセスが丸括弧なことに一層の美しさを感じる。関数だとみなせるということは、mapメソッドに渡す事もできる。

gist.github.com

Seqは原理上インデックスしか定義域に取れないのでPertialFunction[Int, A]を継承している。一方、Mapは定義域の型が自由なのでPertialFunction[A, B]を継承しており、下のような感じで扱える。

gist.github.com

参考：

<a href="http://qiita.com/mtoyoshi/items/700f8c891402854a74b6">Scala - MapにFunction1/PartialFunctionがmix-inされている理由（美しい・・） - Qiita</a>qiita.com

2015-04-03

Continuation-passing style で複数リソースの try-with-resource 構文を入れ子なしで書く

Scala

前回の話の続き。

<a href="http://ym.hatenadiary.jp/entry/2015/04/02/163557">Scala の標準ライブラリを使って try-with-resource 構文相当の表現を書く - ymの日記</a>ym.hatenadiary.jp

末尾の参考文献によれば、CPS: Continuation-passing style（継続渡しスタイル）によって入れ子なしの記述を実現する方法もあるとのことだったので、理解を深めるために書き直しながら試してみた。 Scala の継続渡しスタイル関連の関数は、scala.coutinuationsをインポートすれば使える。ただし、2.11では標準ライブラリから切り離されてしまったので、sbtに依存関係を書く必要がある。

このスタイルでは、ある関数に、通常のように別の関数の結果値を渡す代わりに、「継続」（残りの処理）を関数として渡す。例えば、以下の様な感じ。

gist.github.com

これは、resetとshiftという関数で表現される。 resetは、「継続」として利用する処理のスコープで、shift は継続を渡したい処理。 shiftに渡される関数の引数contは、resetの内側の処理のうち、当該shiftを評価し終わった後の残りの処理。つまり、3行目の val num = の代入処理と、7〜8行目の処理がcont関数として渡される。なので、上のプログラムは、次の順序で処理される。

2行目："A"を出力
3行目：shiftの中を評価し始める
4行目："B"を出力
5行目：内側のcont(1)を呼び出す。
1を shiftの評価値として、「継続」（cont関数）を実行
3行目： num = 1
7行目：(num,1)を出力
8行目：num * 2 を評価する → これがcont(1)の返り値
5行目：外側のcont、cont(2)を呼び出す。
2を shiftの評価値として、「継続」（cont関数）を実行
3行目： num = 2
7行目：(num,2)を出力
8行目：num * 2 を評価する → これがresetの返り値
1行目：n = 4
10行目：(n,4)を出力

これを踏まえて、複数リソースのtry-with-resource 構文を考えると、次のように書ける。

gist.github.com

14〜26行目は、省略せずに書くと

gist.github.com

のようになる。処理の順序は以下のとおり。

一つ目のshiftを評価し始める。
一つ目のusingを評価。tryの中で"op"を出力。
第二引数opに代入されているcontを評価。contは2行目のval w1 =の代入と、5行目以降。
contの引数には、tryの中でop(resource)としてnew PrintWriter("col1.txt")が渡されているので、w1にnew PrintWriter("col1.txt")が代入される。
二つ目のshiftを評価し始める。
二つ目のusingを評価。tryの中で"op"を出力。
第二引数opに代入されているcontを評価。contは5行目のval w2 =の代入と、8行目以降。
contの引数には、tryの中でop(resource)としてnew PrintWriter("col2.txt")が渡されているので、w2にnew PrintWriter("col2.txt")が代入される。
8〜16行目が処理される。この過程で"A" "B"を出力。
二つ目のshiftの中のusingで使われているcont（5行目のval w2 =の代入と、8行目以降）が評価し終わったことになる。このusingのfinally節が実行される。"close"を出力。
5行目以降は全て評価したことになったので、一つ目のshiftの中のcontも評価し終わったことになる。このusingのfinally節が実行される。"close"を出力。

結果の出力は次のようになる。

gist.github.com

下記のStackoverflowの例風に書くと、以下のようになる。

gist.github.com

なるほど現状ではあまり簡潔な記述とは言いがたいが、一応このような方法でも実現可能だということがわかる。ただし、そもそも標準ライブラリには入っていないし、Githubを見ると "The Scala Delimited Continuations Plugin and Library will continue to ship with Scala 2.11.0. However, it will no longer be included with Scala 2.12." とのことなので、新規のコードをこれを使って書くということはないだろう。前回の記事の最後にあったライブラリのように for式を使ったスタイルがシンプルで使い勝手も良い印象。

<a href="https://github.com/scala/scala-continuations">scala/scala-continuations</a>github.com

参考文献：

<a href="http://stackoverflow.com/questions/2207425/what-automatic-resource-management-alternatives-exists-for-scala">What Automatic Resource Management alternatives exists for Scala?</a>stackoverflow.com
<a href="http://fits.hatenablog.com/entry/20100207/1265558277"> Scala の限定継続（Delimited Continuations） - なんとなくな Developer のメモ</a>fits.hatenablog.com

2015-04-02

法律文の構文解析はとっても難しい

言語処理

法律文の構文解析がいかに難しいかをよく説明する例。この例文の中だけでも、かなり難しい要素がある。

↓以下は「一文」です。

労働者の養育する子について、当該労働者の配偶者が当該子の 1 歳到達日以前のいずれかの日において当該子を養育するために育児休業をしている場合における第 2 章から第 5 章まで、第 24 条第 1 項及び第 12 章の規定の適用については、第 5 条第 1 項中「1 歳に満たない子」とあるのは「1 歳に満たない子（第 9 条の 2 第 1 項の規定により読み替えて適用するこの項の規定により育児休業をする場合にあっては、1 歳 2 か月に満たない子）」と、同条第 3 項各号列記以外の部分中「1 歳到達日」とあるのは「1 歳到達日（当該配偶者が第 9 条の 2 第 1 項の規定により読み替えて適用する第 1 項の規定によりした申出に係る第 9 条第 1 項（第 9 条の 2 第 1 項の規定により読み替えて適用する場合を含む。）に規定する育児休業終了予定日とされた日が当該子の 1 歳到達日後である場合にあっては、当該育児休業終了予定日とされた日）」と、同項第 1 号中「又はその配偶者が、当該子の 1 歳到達日」とあるのは「が当該子の 1 歳到達日（当該労働者が第 9 条の 2 第 1 項の規定により読み替えて適用する第 1 項の規定によりした申出に係る第 9 条第 1 項（第 9 条の 2 第 1項の規定により読み替えて適用する場合を含む。）に規定する育児休業終了予定日とされた日が当該子の 1 歳到達日後である場合にあっては、当該育児休業終了予定日とされた日）において育児休業をしている場合又は当該労働者の配偶者が当該子の 1 歳到達日（当該配偶者が第 9 条の 2 第 1 項の規定により読み替えて適用する第 1 項の規定によりした申出に係る第 9 条第 1 項（第 9 条の 2 第1 項の規定により読み替えて適用する場合を含む。）に規定する育児休業終了予定日とされた日が当該子の 1 歳到達日後である場合にあっては、当該育児休業終了予定日とされた日）」と、同条第4 項中「1 歳到達日」とあるのは「1 歳到達日（当該子を養育する労働者又はその配偶者が第 9 条の2 第 1 項の規定により読み替えて適用する第 1 項の規定によりした申出に係る第 9 条第 1 項（第 9条の 2 第 1 項の規定により読み替えて適用する場合を含む。）に規定する育児休業終了予定日とされた日が当該子の 1 歳到達日後である場合にあっては、当該育児休業終了予定日とされた日（当該労働者に係る育児休業終了予定日とされた日と当該配偶者に係る育児休業終了予定日とされた日が異なるときは、そのいずれかの日））」と、前条第 1 項中「変更後の育児休業終了予定日とされた日。次項」とあるのは「変更後の育児休業終了予定日とされた日。次項（次条第 1 項の規定により読み替えて適用する場合を含む。）において同じ。）（当該育児休業終了予定日とされた日が当該育児休業開始予定日とされた日から起算して育児休業等可能日数（当該育児休業に係る子の出生した日から当該子の 1 歳到達日までの日数をいう。）から育児休業等取得日数（当該子の出生した日以後当該労働者が労働基準法第 65 条第 1 項又は第 2 項の規定により休業した日数と当該子について育児休業をした日数を合算した日数をいう。）を差し引いた日数を経過する日より後の日であるときは、当該経過する日。次項（次条第 1 項の規定により読み替えて適用する場合を含む。）」と、同条第 2 項第 2 号中「第 5 条第 3 項」とあるのは「次条第 1 項の規定により読み替えて適用する第5 条第 1 項の規定による申出により育児休業をしている場合にあっては 1 歳 2 か月、同条第 3 項（次条第 1 項の規定により読み替えて適用する場合を含む。）」と、「、1 歳 6 か月」とあるのは「1 歳6 か月」と、第 24 条第 1 項第 1 号中「1 歳（」とあるのは「1 歳（当該労働者が第 9 条の 2 第 1 項の規定により読み替えて適用する第 5 条第 1 項の規定による申出をすることができる場合にあっては 1 歳 2 か月、」と、「、1 歳 6 か月」とあるのは「1 歳 6 か月」とするほか、必要な技術的読替えは、厚生労働省令で定める。

出典元は「育児休業、介護休業等育児又は家族介護を行う労働者の福祉に関する法律」第二章第九条の二。

これくらいになると、人間でも理解するのには図とか書いて整理しないと無理で、私は10分くらいかかりました…。対応のないカッコがあったりして、カッコの高度な意味論と、極めて難度の高い曖昧性解消が必要。