10回くらい見たけど4話の高まりはどう考えてもやばい。3話まではpetit miladyのお遊戯会かと思ってたけど4話の機運が高すぎて怖い。悠木碧さんの演技力がやばい。「前世の料理人が作ったこだわりカレーパンなのです」→ザキヤマ-1点、すごい。竹達彩奈「肉美…
美男高校地球防衛部LOVE! 「アニメってここまで自由に作っていいんだ」って感動したし、ウォンさんが「うざったい!」ってリモコン怪人倒したの見て腹抱えて笑った。こんなん反則や。覇権以外ありえない。 アルドノア・ゼロ いろいろややこしい感じになって…
アブソリュート・デュオ 5話 立ち上がって拍手した。 昨日聖剣使いの禁呪詠唱の4話で感動した翌日にさらに感動した。まさか学校からドーピングされて強くなるシステムとは思ってなかった。ご都合展開とかそんな次元じゃない。アブソリュート・デュオのこと完…
対象 [秋開始アニメ] 七つの大罪 ~15話 SHIROBAKO ~16話 [冬開始アニメ] アルドノア・ゼロ 第2クール ~16話 銃皇無尽のファフニール ~4話 幸腹グラフィティ ~4話 ローリング☆ガールズ ~4話 新妹真王の契約者 ~4話 みりたり! ~4話 聖剣使いの禁呪詠…
kuromoji.jsには学習器がなく、新しい単語を覚えさせて形態素解析に反映させることが現状できない。よって分かち書き、品詞付与は既存辞書に強く依存し、その精度が一番のネックになる。 品詞基準のN-POSはその影響をガッツリ受けてしまい、今の形態素解析で…
前回のあらすじ メカらこv3の文章生成 実装と試運転結果 - らこらこブログ メカらこv3の文章生成 実装と試運転結果 - らこらこブログ もう少し大きな学習データで試す
前回までのあらすじ N-POSモデルとN-gramモデルを線形結合していい感じの文章生成させてみよう 実装してみた
今年もこの日が来ました。 去年はこんな感じでした。きのこの山80箱の暴力に晒された誕生日でしたが今年もAmazonからカロリーが届きました。 カントリーマアムが増えましたね。あとチョコレート系がたくさんです。 画像に撮り忘れたので追加。これも届きまし…
文章生成 N-gramモデルをベースにする 想定されるデータモデル(「今日は雨です」) { w1: "今日", w2: "は", w3: "雨" }, { w1: "は", w2: "雨", w3: "です" } 確率の推定 w3がw2, w1から生起する確率 「w1,w2,w3と並んだ回数」と「w1,w2と並んだ数」の比によ…
Twitterのbotで「語彙の豊富な」「正しい」文章を生成したい 何を持って「正しい」とするか→PCFGで受理できる=構文木が作れる 語彙を増やす方法=バシバシ形態素解析して["品詞", "表層形"]のデータfを集める。この時Nグラムにして、[f1, f2, ..., fn]の組み…
PCFGを使って形態素解析器の学習データを作る計画 ツイッターとかネット上のテキストとか、とてもじゃないけど手動でいちいち辞書追加してたら新しい単語についていけないので自動で学習させたい。品詞も自動で与えたい kuromoji.jsで「艦これって何」の形態…
Google+で面白い議論がなされていたので簡単にまとめてみる。 I use generics a lot in C# but now moving to Dart I keep running in to… 元の投稿はDartのジェネリックがC#と違うことに疑問を投げている なぜジェネリックがメソッドに使えないのか ジェネ…
再来週くらいにアドベントカレンダーでも似たようなこと書くんだけどあっちはちょっとお行儀よく書かなきゃいけないのでこっちには殴り書きという感じで今思ってることを書く 登場人物 vdom 純粋なDartによる仮想DOM実装。diff/patchは型のお陰で速いし、vir…
https://code.google.com/p/dart/issues/detail?id=21558 今回の要望 List型のfirstとfirstWhereが使いにくいので、firstOrDefaultやfirstWhereOrDefaultを作ってくれと頼んだ。 C#のLINQも同じだが、firstは中身が空の時にStateErrorを吐く。firstWhereはマ…
Redstoneはクソ サーバーアプリを書くのに一番活発そうで一番潰れなさそうなRedstoneをとりあえず選んだ。結果的にクソだったけどよかった点もたくさんある。 良かった点 メタデータベースで記述が少なくていい PythonのPyramidにインスパイアされてるっぽい…
諦 herokuで形態素解析と文章生成させるのは諦めました。でもやっぱりDartで書きたいので自然言語処理的な役割を完全になくしてとりあえずbbopだけ実装することにしました。 Dartのmongo_driverとredstone_mapper_mongoとListがクソ _mongodb.findOneがうま…
遅い メカらこv3になってからとにかく遅くなった。文章の生成アルゴリズム自体は速いのだけど、動かしているのがherokuの無料枠なのでプロセスがひとつしかなく、非同期処理で並列化はできても平行化はできずに処理が間に合ってない。 解決策 herokuのワーカ…
先日からメカらこを再実装し始めた。C#でUserStream監視と形態素解析、文章生成まで全部やってたv1はなかなか便利ではあったけどC#ってのが実行環境を選ぶので、サーバー側とbot側を分離しようと思ってv2はサーバーをGo言語で書いてた。でもある程度書いたと…
一度でいいので『~なnつの理由』ってタイトルを使ってみたかった。いつも先にタイトルを決めるのだが、3つと書いてしまったので3つ書く。 初めてDartを知ったのは去年、Google I/O 2013の報告会であるGDG DevFest Japan 2013だった。あんどうさんのDartのセ…
ついに本日6月7日、Android向けTwitterクライアント「SmileEssence」の製品版リリースが出来ました!
以前にも同じようなAPIを作ったんですがC#/ASP.NETからGolang/GAEというすごいお引越しをしました。 APIドキュメントはこちらです。 http://appengine.lacolaco.net/ http://appengine.lacolaco.net/eventsで、直近200件の勉強会のリストを返します。 件数や…
第3回ではStreamingAPIの使い方について紹介しました。 今回はその他のよく使うAPIの使い方をまとめて紹介します。 なおソースコード中に登場するtokensとstatusは前回までに紹介したTokensとStatusです。 Statuses系 ツイートの取得 お気に入りへの追加 お…
第2回ではタイムラインの取得やツイートの投稿について紹介しました。 今回はツイッタークライアントを作るならもはや必須のStreamingAPIをCoreTweetから利用してみます。 ところで、第0回でも触れましたが、CoreTweetにはStreamingAPIの非同期処理をReactiv…
前回は認証の方法を紹介しました。 今回はタイムラインの取得とツイートの投稿を紹介します。 タイムラインの取得 CoreTweetの設計は、Twitter APIの設計と似せてあります。 実際のエンドポイントが/statuses/にあるAPIは、Tokens.Statusesプロパティからア…
第0回ではCoreTweetの特徴と導入について紹介しました。 今回から実際の使い方について紹介します。 認証 Twitterアプリを作る上でまず最初に必要なのは認証です。CoreTweetではTokensというクラスが認証情報を管理します。 Tokensのインスタンスを生成する…
C#でTwitterのAPIを利用するには今まで、Twitterizer2や、TweetSharp、LinqToTwitterなどのライブラリを使うか、自前でHttpClientなどを用いるのが主流でした。しかし、Twitterizer2とTweetSharpは本家リポジトリは開発凍結宣言を出し、有志によるメンテナン…
@vvakameさんや@grapswisさんが推しまくってるTypeScript with AngularJS(逆かな?)でのWeb開発に、サーバーサイドとしてASP.NETのWebAPIを使って簡単なWebアプリを作りましたURLはこちら http://app.lacolaco.net/TokenCreator/ 大変味気ないレイアウトに…
前回(http://laco0416.hatenablog.com/entry/2014/02/09/153315)言ってたとおり、構文解析に成功した文章の品詞列を記憶して利用する方法を採用しました。おかげさまで人間らしい構文で文章生成するようになりました生成が遅いのはEntityFrameworkの酷使だ…
進捗報告と今後についてとりあえずPCFGとトリグラムモデルでのマルコフ連鎖を組み合わせた文章生成botは完成してます。PCFGのC#での実装の解説については近いうちに別の場所でPCFGそのものの解説も含めてしようと思います文章生成系の実装ですが今の流れは …
今日はめちゃくちゃ実装を進めました構文木を作るにあたってMeCabが吐き出す生の形態素のままでは細分化されすぎていてとても文法規則を定義しきれないので、ある程度の補正が必要だということに気づいたということで思いついたのは連続する重複品詞を結合す…