文字数カウントバイトについて

◆ざっくり概要

やってもらうのは、
twitter4j-2.5.5というライブラリの文字数カウントです。
↓ここにファイル一式をアップロードしておきました。
http://synaesthesia.jp/data/twitter4j.zip

こんなことを頼もうと思った理由は、このサイトを見て、面白そうだなーと思った、ってだけです。笑
http://gigazine.net/news/20110607_keyboard_frequency_sculpture/

バイト代は3000円です。
納品を確認してから3日以内くらいには支払います。
銀行振込を予定していますが、他の方法(郵送とか)がよかったら言ってください。

納期は、今週の木、金くらいを予定しています。
別にいつでもいいので、遅れる際は事前にご連絡ください。

このファイルの説明を見て、やっぱり面倒だなーと思ったらそこでやめてもらっても大丈夫ですよ。笑


◆こまごまとした要件

カウントしてもらうのは、ファイル内にでてくる文字全部です。
タブ、半角空白、全角空白、改行もそれぞれカウントしてください。
改行について、LF、CR、CR+LFのどれであろうとも、合算して1回の改行としてカウントしてください。

ファイル内にでてくるエスケープされた文字、例えば、「\"」みたいなやつは、
バックスラッシュ1回、ダブルクオーテーション1回、とカウントしてください。

要は、「ファイル内の文字数をカウントする」、という要件を満たしてもらえれば大丈夫です。


文字数カウントはたぶんプログラムでやるんだと思いますが、
合ってるのかどうかの検証に使うので、作ったプログラムは提出してください。
もしできるなら、Java、PHPで実装してもらえると助かります。他の言語でも大丈夫です。

※どんな言語でどんな風に実装するのか、先にざっくりと教えてもらえると助かります。


他にも質問があったら何でも言ってください。