目次へ戻る

Rでデータを読み込む

データの読み込み方を説明する前に、日本語の文字コードについて少しお話をします。

RStudioを使って日本語を含むファイルを保存するときに次のようなウィンドウが表示されることがあります。このときは、SHIFT-JISを選択するのが一番トラブルが少ないようです。

同様に、日本語を含んだファイルを開いて文字化けが起きる場合は、FileメニューからReopen with Encodingを選択して、SHIFT-JISを選んで開きます。ただし、開きたいファイルがSHIFT-JISで保存されていることを前提としています。保存されているファイルの文字コードを適切に選択すれば、UTF-8などでも開くと思います。

さて、私の解説においては、心理学のための統計学 全9巻(誠信書房)の書籍を参考にして、公開されているデータ(CSVファイル)を使用しています。RでCSVファイルを読み込むには、

dat <- read.csv("CSVファイル名")

としますが、時々、次のようなエラーが出ることがあるようです。

read.table(file = file, header = header, sep = sep, quote = quote, でエラー:
列名よりも列数のほうが多いです

または、

make.names(col.names, unique = TRUE) でエラー:
不正なマルチバイト文字があります

このようなエラーが出たときには、CSVファイルをエクセルで開きます。そしてファイルから名前を付けて保存を選択します。すると下図のように「CSV UTF-8(コンマ区切り)と表示されるのではないかと思います。

そのときは、CSV(コンマ区切り)に変更して、別名で保存してください。

これでread.csvのエラーが解消されるはずです。

Copyright(c) 2011 Department of Psychology, School of Letters, Graduate School of Human-Environment Studies, Kyushu University. All Rights Reserved. Designed by o2BusinessTheme