spreadsheetへの貼り付け時にダブルクォーテーションが消える

spreadsheetに以下のような複数行のテキストをコピペして貼り付けるとダブルクォーテーションが消える "example1" "example2" ちなみにコピーするのが一行だけだとちゃんとダブルクォーテーションも貼り付けられるどうやらテキスト先頭にダブルクォーテーシ…

2021-06-19

colab proを使ってみた

colaboratory

1ヶ月だけcolab proを使ってみたのでメモ https://jsapachehtml.hatenablog.com/entry/2021/06/16/094213 こちらの記事で少し書いたが、学習に数日かかるものだったため再実行の頻度を下げようと思って一度使ってみることにした colaboratoryの無料版、有料…

#colaboratory

2021-06-16

coqui-ai/ttsで日本語音声合成を試す

machine learning sound pytorch

いままで音声の生成はやってみたことがないため勉強のためにやってみたのでメモ。目的としてはどういうことを行っているのか理解したいというのと、TTSを学習させてみた場合にどの程度のコストがかかってどのくらいの音声が生成できるのかというのが気にな…

#TTS #machine learning #Deep learning

2021-05-01

colaboratoryとGCSのregionを一致させる

colaboratory gcp machine learning

https://jsapachehtml.hatenablog.com/entry/2021/04/25/142900 こちらの書いたことの補足として調べたことをメモサーバの位置を割り出すipinfo.ioを参照するのが簡単そうだった。モダンなIPアドレス表示サービス「ipinfo.io」 - ソフトアンテナブログ col…

#colaboratory #GCP #machine learning

2021-04-25

colaboratoryで使うdatasetをどこに置いておくのがよいか調べる

colaboratory machine learning linux gcp

前回こんな記事を書いたが、どこに置いておくのが効率よいのか気になったので調べてみた https://blog.hatena.ne.jp/y-kamiya/jsapachehtml.hatenablog.com/edit?entry=26006613718710543 colaboratoryは起動のたびにまっさらの状態になるためデータセットな…

#colaboratory #machine learning #GCP

2021-04-20

google colaboratoryでGCSからデータ取得

colaboratory machine learning

gcsとデータをやり取りする場合、gcloudを入れて初期設定をしてから付属のgsutilを使うという流れでやっていたが、実はgcloudは入れなくてもよいことに気づいたのでメモ gsutilの公式のインストール方法として、Pythonパッケージからのインストールという項…

#colaboratory #machine learning

2021-03-21

google colaboratoryで効率よくデバッグしたい

colaboratory machine learning

google colaboratoryはgpuやtpuを無料で使うことができ大変便利だが、gpu関連の処理をデバッグしたい場合などは多少手間がかかる colab上での実行が必須のコードのデバッグ時に私が行っていた手順は以下ローカルでコードを変更適当にコミット colab上でgit…

#Tools #GoogleDrive #効率化

2021-02-11

テキスト感情分類(マルチラベル)

pytorch machine learning

こちらの記事で追加でやってみると書いたことのいくつかについてやったのでメモ https://jsapachehtml.hatenablog.com/entry/2021/01/17/142444 マルチラベル分類参考にしたこちらの論文と同じ形にして精度を比べてみることにした（英語のデータセットで） …

2021-01-17

日本語のテキスト感情分類をやってみる

machine learning pytorch

感情分類は以下の２通りに大分けされる模様 positive/negativeの二値分類(neutralを含める場合もあり) joy, sadnessなど複数の感情に分類このうち特に2.についてはapiとして公開されているものもそこまで多くない印象なのでこちらについてやってみることに…

#machine learning #BERT #Emotion #Python #NLP #Pytorch

2021-01-10

tensorflowで指定の位置の値だけを抽出して次元を減らす

machine learning python

元々やろうとしたことは、transformerの出力から各sentenceの末尾にあたるtokenのembeddingsだけを取り出すこと tensorflowは今までそこまで書いたことはなかったため、やってみると意外と時間がかかったためメモ例として以下のような形を考える # 元のtens…

#machine learning #Python #TensorFlow

2021-01-04

特定のコマンド実行が終わるまでPCをスリープさせない(mac)

時間のかかる処理をローカルPCで動かしている場合などスリープさせたくないことがある PCの電源管理の設定でスリープしないようにすればOKだが、当然それだと必要な処理が終わった後でもスリープにならないため無駄以下のコマンドで実行中のみスリープにな…

2020-12-31

colaboratoryに表を出力すると崩れる

tabulateで表を出力した際に以下のように崩れた文字によって幅が異なっていることが原因（=等幅フォントじゃない） chromeのフォント設定を見てみるとOsakaになっている colaboratoryの編集用セルや出力欄は↑の設定の固定幅フォントが使われているただ謎な…

2020-12-19

音に対するdeep learningの入門として環境音の識別をやってみる(3)

python pytorch machine learning sound

こちらの続き https://jsapachehtml.hatenablog.com/entry/2020/10/24/183410?_ga=2.58998701.1453230663.1604732830-1050067043.1602897991 今回はBC Learningを実装してみたのでメモ BC Learning 論文: https://arxiv.org/pdf/1711.10282.pdf 公式repo: ht…

#machine learning #Pytorch

2020-12-13

torchaudioをインストールするとtorchがcpu用のものになる

python pytorch

colab上でtorchaudioをインストールして使っていたのだが、いつの間にか学習速度が落ちていた $ !import torch $ !print(torch.cuda.is_available()) False とりあえずやってみると上記のようになったのでgpuが使えていないことがわかる先月実行した際は同…

2020-11-29

owner権限を持っているディレクトリでOperation not permitted

ストレージの整理のために~/Library以下などをチェックしていたところ見られないところがあった。 $ ls -l ~/Library/Application\ Support/MobileSync ls: MobileSync: Operation not permitted sudoをつけても同じで、そもそもownerだったのでsudoいらない…

2020-11-22

module 'tweepy' has no attribute 'OAuthHandler'

python

こんなエラーが出た場合のしょうもないハマりについてメモググると同じエラーについて出てくるがどれも当てはまらず。なので挙動を調べるためにimport元のファイルがどこにあるかチェック > import tweepy > tweepy.__file__ <path to current directory>/tweepy.py ということで、実行</path>…

2020-11-22

server version is too old for client

mac ubuntu

itermでコマンド実行後にこのメッセージが出るようになったどうやらメッセージの出どころはtmuxのようで、tmuxをupdateしたものの古いsessionをそのまま利用している状態で出る模様 https://github.com/tmux/tmux/issues/2212 こちらで一度落として起動しな…

2020-11-03

pytorchで処理が重いとき on colaboratory

pytorch python

pytorchを使ったモデルで学習を行っている際、処理が重い場合があったためその調査/解決方法についてメモちなみにgpuは基本的にgoogle colab上で使っているためその前提で gpuが使えていない処理が重い場合の一番の原因がこれ。その環境でgpuが利用可能か…

2020-10-24

音に対するdeep learningの入門として環境音の識別をやってみる(2)

python pytorch machine learning sound

こちらの記事の続き https://jsapachehtml.hatenablog.com/entry/2020/10/17/231526 今回はEnvNetを実装してみたのでメモ EnvNet 論文：https://www.mi.t.u-tokyo.ac.jp/assets/publication/LEARNING_ENVIRONMENTAL_SOUNDS_WITH_END-TO-END_CONVOLUTIONAL_NE…

#machine learning #pytorch #sound

2020-10-17

音に対するdeep learningの入門として環境音の識別をやってみる

python pytorch machine learning sound

音の扱いがどのようになっているか知りたいと思ったため、最も簡単にできそうなものということで環境音の識別をやってみることにしたいろいろググっているとこちらのqiitaがこれまでの経緯をまとめてくれていたためこれを参考にしていくつか実装してみる ht…

#machine learning #Pytorch #sound

2020-10-11

pytorchで評価時のみOut of memory

trainingは問題なくできるのが、評価の段階になるとメモリー不足で落ちることがあった。データセットのサイズとしてはメモリ不足になるような大きさではないため、ロジックを調べてみるとtensorを加算する処理をtorch.no_gradなしにやっていることが原因だ…

2020-09-05

Bertで不自然な文を検知してみる

Bertなどの学習済みのモデルは、多くのデータから最もありえそうな単語の並びのパターンを学習しているといえる。なので文法的に間違っている場合など不自然な位置に単語があったりすれば、その単語の出現確率は低く出るはず。ということで簡単なスクリプ…

2020-08-29

haskellでちょっとした処理のメモ

haskell

久しぶりにhaskellを触ったので、その際に調べたtips的な処理についてメモリストのslice https://stackoverflow.com/questions/4597820/does-haskell-have-list-slices-i-e-python slice :: Int -> Int -> [a] -> [a] slice from to xs = take (to - from +…

2020-08-23

nix環境でhaskellのprojectをビルド

haskell nix

久しぶりにhaskellを触った際によくわからなくなって調べたのでメモとりあえずビルドしたいときのチートシート的にまとめておく基本的にこちらに書いてある通り Getting Started Haskell Project with Nix | MaybeVoid nixはinstall済みだったが一応 ghcと…

2020-08-01

UnityWebRequestでローカルファイルをコピーしたらサイズが0になる

unity

UnityWebRequestによってローカルのファイルを別のパスへコピーできる例えばstreamingAssetsをpersistentDataへコピーする場合は以下のような処理 var src = $"{Application.streamingAssetsPath}/src.bytes" var tgt = $"{Application. persistentDataPath…

2020-07-18

opencvで透過pngが変な画像になる

python

opencvで処理したpng画像を再度imwriteで保存するとおかしな模様が出ている場合があった例えば単純に以下のようにした場合 image = cv2.imread(image_path) imwrite('/tmp/image.png', image) 調べてみると原因はalphaチャネルが0のpixelでもRGBの値は入っ…

2020-05-04

transformerを理解するため実装してみる(実データで学習)

以前copy taskまで実装したものについてまとめた transformerを理解するために実装 - MEMOcho- 今回はそれを実際のデータで学習するところを実装したのでメモ目次 sentenceのtoken化長過ぎる文を削除 fp16対応 colabでの学習評価指標実行結果 seq2seq tu…

2020-04-29

複数のファイルから同じ行を消す

機械翻訳用のデータは言語毎にファイルは別になっていて、文同士の対応は行番号が同じことによって保たれている例えばこんな感じ # ja.txt こんにちは私はテニスが好きです私はペンを持っています # en.txt hello I like tennis I have a pen これをtoken…

2020-04-28

別のPCにちょっとしたものを共有したいとき

家にあるPCで作業しているとき、もう一台のマシンでちょっと前に打ったコマンドをそのまま使いたいことがあった。メールやチャットで自分宛てに送ればそれでOKだが、一旦外を通って戻ってくるというのがなんだか無駄に感じてしまったためマシン間で直接やり…

2020-04-26

transformerを理解するために実装

自分の勉強のためにtransformerを実装してみたので引っかかったところなどメモ実装の参考にしたのは主にこの3つ http://nlp.seas.harvard.edu/2018/04/03/attention.html pytorchによる実装ともに論文の流れに沿って解説 learning rateのscheduleなど細かい…