lupinus's diary

港区のデータサイエンティスト、縫物したり自転車に乗るのが好きな人の色んな記録を行う予定のブログ

分析環境を作ってみた

qiita.com qiita.com pyenvとanacondaを共存させる時のactivate衝突問題の回避策3種類 pyenvを使わない。 決定版は基本的にこの方法を紹介しています。 この方法ではpyenvはanacondaのインストーラとしてのみ使います。 pyenv経由でanacondaをインストール後…

mac買ったのでhomevrewを使っていろいろ入れた

まずはxcodeをapplestoreからインストールして $ xcode-select --install からCommand Line Toolsをインストールしておく。 参考にさせていただきました。 brew.sh MacにHomebrewをインストールする 新卒エンジニア向け:Macにインストールすべきアプリ達 ベ…

Python | irisのデータセットについて

この記事に書いてあること scikit-learnライブラリの中のirisのデータのまとめと簡単な使い方 はじめに PythonはRと違ってデータの型?ごとに使えるメゾットが違うのでこんがらがってしまうので個人的にまとめてみました。 コードについて # scikit-learnラ…

Python | pandasのデータ型について

この記事に書いてあること pandasの概要について pandasのデータ型(シリーズ、データフレーム、パネル)について はじめに Rでずっとdplyrを使っていたのでデータフレーム型を使えるpandasはとても重宝しています。 今回はpandasについてまとめてみます。 Pyt…

Python | モジュールとパッケージのimportについて

この記事に書いてあること モジュールとパッケージのimportのパターンまとめ はじめに 私はRを研究などでたくさん使っていたのですが、Pythonははじめてなので備忘。 Pythonの初心者すぎてパッケージのインストールから私はググりましたw Pythonの基礎的な…

R | 地理情報のビジュアライゼーション及び加工(1)

地理情報の種類について 緯度経度 メッシュコード GIS GISとは 地理情報システム(GIS:Geographic Information System)の略称。 地理空間情報とは、空間上の特定の地点又は区域の位置を示す情報(位置情報)とそれに関連付けられた様々な事象に関する情報…

R | フォルダの中のデータ(.dbf, .csv等)を大量に読み込む方法

dbfファイルをRで読み込む方法 フォルダの中身(ファイルの形式が同じ場合)を全て読み込む方法 1. dbf をRで読み込む方法 library(foreign) df <- read.dbf("C:/~~~~/***.dbf", as.is = T) # as.is = T :factorではないとする # factorのままにすると色々と悪…

地理空間情報処理の基礎知識(用語編)

地理情報を統計的に扱いたいので、そのための用語の備忘録。

R | 緯度経度とメッシュコードの相互変換

R | 土地の地名を使って自然言語処理を行ってみる (1)

目的 土地の地名の漢字と災害の関係性を調べること 例:竜,龍という文字が地名に入っていると水害に合いやすいなど データ収集 位置参照情報ダウンロードサービスからデータを取得しました。 ここで公開されているデータは緯度経度と市区町村以下の土地名が…

R | dplyrパッケージselectの備忘

#まとめて列を消す #日本語は使えないらしい library(dplyr) dat <- dat %>% dplyr::select( -(flag.1 : flag.4))