Scala日記

Scalaの備忘録。ときどき研究の話。

2015-07-03から1日間の記事一覧

UTF-8のはずのテキストの処理中に MalformedInputException で落ちる場合の対処

Webなどから取ってきた巨大な文書ファイルを処理するとき、UTF-8エンコーディングで処理したはずだったのに、中間処理に使った言語の仕様なのか処理ミスなのか、とにかく何らかの理由があって、Scalaで読み込む際に MalformedInputException が発生してしま…

Spark用sbtプロジェクトの設定

プロジェクトセットアップ build.sbtに以下のコードを書いて、sbt update gist.github.com ソースを書く src/main/scala/SampleApp.scala gist.github.com ビルド sbt package 実行 spark-submit \ --class SampleApp \ --master yarn-cluster \ --num-execu…