https://rpubs.com/koyobib/bm07 の続き

library(readr)
library(openxlsx)
library(stringr)
library(stringdist)
library(dplyr)
library(RMeCab)
library(igraph)
library(rvest)
library(gt)
library(gtExtras)
library(openxlsx)
library(purrr)

1 「教育学研究」の書誌データの取得

1.1 DOIなどのファイルの読み込み

DOIは手作業で収集した

list <- read.xlsx("../Lists/JJER_2006.xlsx", sheet = 1)

# 手作業なので重複を確認
# list %>% group_by(DOI) %>% filter(n()>1)

head(list)
##   Journal Year Volume Number Page             DOI      Class Incld
## 1    JJER 2022     89      4  513 kyoiku.89.4_513 特集巻頭言  除外
## 2    JJER 2022     89      4  514 kyoiku.89.4_514       特集  収集
## 3    JJER 2022     89      4  526 kyoiku.89.4_526       特集  収集
## 4    JJER 2022     89      4  539 kyoiku.89.4_539       特集  収集
## 5    JJER 2022     89      4  552 kyoiku.89.4_552       特集  収集
## 6    JJER 2022     89      4  565 kyoiku.89.4_565       特集  収集
##                JYVNP
## 1 JJER_2022_89_4_513
## 2 JJER_2022_89_4_514
## 3 JJER_2022_89_4_526
## 4 JJER_2022_89_4_539
## 5 JJER_2022_89_4_552
## 6 JJER_2022_89_4_565

1.2 収集対象データを取り出す

  • 論文,研究ノート,特集論文,特集研究ノートが対象
  • 特集の巻頭言や和文要約のないものは除外
  • 連載も除外(アブストなんでつけないの?)
doi <- list %>% dplyr::filter(Incld != "除外")
head(doi)
##   Journal Year Volume Number Page             DOI Class Incld
## 1    JJER 2022     89      4  514 kyoiku.89.4_514  特集  収集
## 2    JJER 2022     89      4  526 kyoiku.89.4_526  特集  収集
## 3    JJER 2022     89      4  539 kyoiku.89.4_539  特集  収集
## 4    JJER 2022     89      4  552 kyoiku.89.4_552  特集  収集
## 5    JJER 2022     89      4  565 kyoiku.89.4_565  特集  収集
## 6    JJER 2022     89      4  579 kyoiku.89.4_579  特集  収集
##                JYVNP
## 1 JJER_2022_89_4_514
## 2 JJER_2022_89_4_526
## 3 JJER_2022_89_4_539
## 4 JJER_2022_89_4_552
## 5 JJER_2022_89_4_565
## 6 JJER_2022_89_4_579

1.3 アブストを論文ごとにデータ化してcsvで保存

doi2 <- doi$DOI
for (i in doi2){
  url  <- paste("https://doi.org/10.11555/", i, sep = "")
  html <- read_html(url)
  name <- html %>% 
    html_elements("meta") %>%
    html_attr("name")
  name <- (data.frame(name))
  text <- html %>% 
    html_elements("meta") %>%
    html_attr("content")
  text <- (data.frame(text))
  name.text <- dplyr::bind_cols(name, text)
  abstract <- name.text %>% dplyr::filter(name == "abstract")
  abstract$doi <- i

  assign(i, abstract) # データ化
  
  # csvで保存
  setwd("../JJER")
  csvname <- paste(i, ".csv", sep = "")
  write.csv(abstract, csvname)
  }

1.4 アブストのデータを列結合する

ここはfor文を使うよりも,用意したリストから読み出した方が早い気がする。

abst1 <- rbind(kyoiku.89.4_514, kyoiku.89.4_526, kyoiku.89.4_539, kyoiku.89.4_552, kyoiku.89.4_565, kyoiku.89.4_579, kyoiku.89.4_590, kyoiku.89.4_603, kyoiku.89.4_616, kyoiku.89.4_629, kyoiku.89.4_642, kyoiku.89.4_655, kyoiku.89.4_670, kyoiku.89.4_683, kyoiku.89.4_692, kyoiku.89.4_704, kyoiku.89.4_716, kyoiku.89.4_729, kyoiku.89.3_397, kyoiku.89.3_409, kyoiku.89.3_422, kyoiku.89.3_435, kyoiku.89.2_182, kyoiku.89.2_195, kyoiku.89.2_207, kyoiku.89.2_220, kyoiku.89.2_232, kyoiku.89.2_245, kyoiku.89.2_258, kyoiku.89.2_271, kyoiku.89.2_284, kyoiku.89.1_1, kyoiku.89.1_14, kyoiku.89.1_27, kyoiku.88.4_532, kyoiku.88.4_545, kyoiku.88.4_558, kyoiku.88.4_573, kyoiku.88.4_585, kyoiku.88.4_597, kyoiku.88.4_610, kyoiku.88.4_622, kyoiku.88.4_634, kyoiku.88.4_646, kyoiku.88.4_658, kyoiku.88.4_671, kyoiku.88.3_381, kyoiku.88.3_394, kyoiku.88.3_406, kyoiku.88.3_419, kyoiku.88.3_432, kyoiku.88.3_445, kyoiku.88.2_146, kyoiku.88.2_158, kyoiku.88.2_171, kyoiku.88.2_184, kyoiku.88.2_197, kyoiku.88.2_211, kyoiku.88.2_223, kyoiku.88.2_235, kyoiku.88.2_247, kyoiku.88.2_259, kyoiku.88.2_273, kyoiku.88.2_285, kyoiku.88.2_295, kyoiku.88.1_1, kyoiku.88.1_14, kyoiku.88.1_27, kyoiku.87.4_468, kyoiku.87.4_482, kyoiku.87.4_495, kyoiku.87.4_508, kyoiku.87.4_521, kyoiku.87.4_533, kyoiku.87.4_546, kyoiku.87.4_558, kyoiku.87.4_572, kyoiku.87.4_585, kyoiku.87.4_597, kyoiku.87.4_609, kyoiku.87.4_621, kyoiku.87.3_329, kyoiku.87.3_342, kyoiku.87.3_354, kyoiku.87.3_367, kyoiku.87.3_379, kyoiku.87.2_178, kyoiku.87.2_190, kyoiku.87.2_203, kyoiku.87.2_214, kyoiku.87.2_227, kyoiku.87.1_1, kyoiku.87.1_13, kyoiku.87.1_25, kyoiku.86.4_461, kyoiku.86.4_473, kyoiku.86.4_485, kyoiku.86.4_497, kyoiku.86.4_509, kyoiku.86.4_524, kyoiku.86.4_537, kyoiku.86.4_550, kyoiku.86.4_565, kyoiku.86.3_385, kyoiku.86.2_162, kyoiku.86.2_176, kyoiku.86.2_188, kyoiku.86.2_201, kyoiku.86.2_213, kyoiku.86.2_225, kyoiku.86.2_237, kyoiku.86.2_249, kyoiku.86.2_262, kyoiku.86.2_275, kyoiku.86.2_287, kyoiku.86.1_1, kyoiku.86.1_13, kyoiku.85.4_420, kyoiku.85.4_433, kyoiku.85.4_446, kyoiku.85.4_458, kyoiku.85.4_471, kyoiku.85.4_483, kyoiku.85.3_283, kyoiku.85.3_296, kyoiku.85.3_309, kyoiku.85.3_321, kyoiku.85.2_138, kyoiku.85.2_150, kyoiku.85.2_162, kyoiku.85.2_175, kyoiku.85.2_186, kyoiku.85.2_196, kyoiku.85.1_1, kyoiku.84.4_398, kyoiku.84.4_410, kyoiku.84.4_421, kyoiku.84.4_434, kyoiku.84.3_287, kyoiku.84.2_130, kyoiku.84.2_143, kyoiku.84.2_155, kyoiku.84.2_168, kyoiku.84.2_180, kyoiku.84.2_192, kyoiku.84.2_205, kyoiku.84.2_215, kyoiku.84.1_1, kyoiku.83.4_384, kyoiku.83.4_398, kyoiku.83.4_411, kyoiku.83.4_423, kyoiku.83.4_436, kyoiku.83.4_448, kyoiku.83.4_461, kyoiku.83.4_474, kyoiku.83.3_289, kyoiku.83.3_302, kyoiku.83.2_140, kyoiku.83.2_154, kyoiku.83.2_167, kyoiku.83.2_181, kyoiku.83.2_194, kyoiku.83.2_207, kyoiku.83.1_1, kyoiku.83.1_13, kyoiku.82.4_520, kyoiku.82.4_531, kyoiku.82.4_543, kyoiku.82.4_558, kyoiku.82.4_571, kyoiku.82.4_583, kyoiku.82.3_389, kyoiku.82.3_402, kyoiku.82.3_415, kyoiku.82.3_427, kyoiku.82.2_188, kyoiku.82.2_202, kyoiku.82.2_216, kyoiku.82.2_229, kyoiku.82.2_241, kyoiku.82.2_253, kyoiku.82.2_265, kyoiku.82.2_277, kyoiku.82.2_287, kyoiku.82.2_299, kyoiku.82.1_1, kyoiku.82.1_13, kyoiku.82.1_25, kyoiku.82.1_36, kyoiku.81.4_384, kyoiku.81.4_396, kyoiku.81.4_408, kyoiku.81.4_423, kyoiku.81.4_436, kyoiku.81.4_448, kyoiku.81.4_460, kyoiku.81.4_473, kyoiku.81.4_484, kyoiku.81.3_297)

abst2 <- rbind(kyoiku.81.3_310, kyoiku.81.2_138, kyoiku.81.2_150, kyoiku.81.2_164, kyoiku.81.2_176, kyoiku.81.2_187, kyoiku.81.2_200, kyoiku.81.2_214, kyoiku.81.1_1, kyoiku.81.1_14, kyoiku.81.1_26, kyoiku.81.1_37, kyoiku.80.4_402, kyoiku.80.4_414, kyoiku.80.4_427, kyoiku.80.4_439, kyoiku.80.4_453, kyoiku.80.4_466, kyoiku.80.4_478, kyoiku.80.4_491, kyoiku.80.4_503, kyoiku.80.3_309, kyoiku.80.3_322, kyoiku.80.2_160, kyoiku.80.2_172, kyoiku.80.2_185, kyoiku.80.2_197, kyoiku.80.2_210, kyoiku.80.2_222, kyoiku.80.2_235, kyoiku.80.1_1, kyoiku.80.1_13, kyoiku.80.1_26, kyoiku.80.1_39, kyoiku.79.4_354, kyoiku.79.4_367, kyoiku.79.3_275, kyoiku.79.3_286, kyoiku.79.2_144, kyoiku.79.2_156, kyoiku.79.2_170, kyoiku.79.2_182, kyoiku.79.2_194, kyoiku.79.1_1, kyoiku.79.1_13, kyoiku.78.4_336, kyoiku.78.4_348, kyoiku.78.4_361, kyoiku.78.4_374, kyoiku.78.4_386, kyoiku.78.4_398, kyoiku.78.4_411, kyoiku.78.4_423, kyoiku.78.4_439, kyoiku.78.4_450, kyoiku.78.3_251, kyoiku.78.2_114, kyoiku.78.2_126, kyoiku.78.2_138, kyoiku.78.2_150, kyoiku.78.2_162, kyoiku.78.2_174, kyoiku.78.2_187, kyoiku.78.1_1, kyoiku.77.4_346, kyoiku.77.4_358, kyoiku.77.4_371, kyoiku.77.3_255, kyoiku.77.3_271, kyoiku.77.2_132, kyoiku.77.2_144, kyoiku.77.2_157, kyoiku.77.2_171, kyoiku.77.2_183, kyoiku.77.1_1, kyoiku.76.4_400, kyoiku.76.4_412, kyoiku.76.4_424, kyoiku.76.4_438, kyoiku.76.3_309, kyoiku.76.3_322, kyoiku.76.3_334, kyoiku.76.2_172, kyoiku.76.2_185, kyoiku.76.2_197, kyoiku.76.2_208, kyoiku.76.2_220, kyoiku.76.1_1, kyoiku.76.1_13, kyoiku.76.1_33, kyoiku.75.4_356, kyoiku.75.4_368, kyoiku.75.4_381, kyoiku.75.4_393, kyoiku.75.3_263, kyoiku.75.3_276, kyoiku.75.3_289, kyoiku.75.2_146, kyoiku.75.2_157, kyoiku.75.2_169, kyoiku.75.2_192, kyoiku.75.1_1, kyoiku.75.1_13, kyoiku.75.1_24, kyoiku.75.1_34, kyoiku.74.4_428, kyoiku.74.4_440, kyoiku.74.4_455, kyoiku.74.4_467, kyoiku.74.4_480, kyoiku.74.4_493, kyoiku.74.4_505, kyoiku.74.4_518, kyoiku.74.4_530, kyoiku.74.4_542, kyoiku.74.4_554, kyoiku.74.3_321, kyoiku.74.3_335, kyoiku.74.3_348, kyoiku.74.3_360, kyoiku.74.2_140, kyoiku.74.2_152, kyoiku.74.2_162, kyoiku.74.2_174, kyoiku.74.2_189, kyoiku.74.2_203, kyoiku.74.2_215, kyoiku.74.2_226, kyoiku.74.2_240, kyoiku.74.1_1, kyoiku.74.1_13, kyoiku.74.1_28, kyoiku.73.4_324, kyoiku.73.4_350, kyoiku.73.4_363, kyoiku.73.4_376, kyoiku.73.4_391, kyoiku.73.4_403, kyoiku.73.4_420, kyoiku.73.4_432, kyoiku.73.4_444, kyoiku.73.4_457, kyoiku.73.4_470, kyoiku.73.3_207, kyoiku.73.2_98, kyoiku.73.2_110, kyoiku.73.2_125, kyoiku.73.2_137, kyoiku.73.1_1, kyoiku.73.1_15, kyoiku.73.1_27)

abst <- rbind(abst1, abst2)
abst <- abst[c(3,2)]
colnames(abst) <- c("DOI", "Abst")
head(abst)
##               DOI
## 1 kyoiku.89.4_514
## 2 kyoiku.89.4_526
## 3 kyoiku.89.4_539
## 4 kyoiku.89.4_552
## 5 kyoiku.89.4_565
## 6 kyoiku.89.4_579
##                                                                                                                                                                                                                                                                                                                                                                                                                                                   Abst
## 1                     男女の特性論は、明治初年、男女同権論と男尊女卑の両方を否定するものとして成立し、戦前の女子教育の主要な教育理念となった。特性論は戦後の男女共学制においても維持され、教育課程の男女格差は、男女の本質的平等を保障するための合理的な差異と見なされた。1985年の女性差別撤廃条約の批准とジェンダー論の普及により特性論は終焉するが、今日、男女を区別すること自体が「差別」と見なされる中で、女子教育の存在意義が改めて問われている。
## 2                                 少数派の親の意思をどのように位置づけるかという公私二元論問題抜きに性教育論争を理解することはできない。宗教が扱ってきた「性」、また近代社会が私的なことがらとした「性」を、公教育で積極的に扱うのが性教育だからだ。教育内容のみならず性教育の実施そのものに同意できない宗教関係者などからの批判が登場して性教育論争となる。本稿では、イギリス、アメリカおよび日本の性教育論争の特徴とこの論点への対処方法を整理した。
## 3 本研究は、ドイツの幼児教育界を牽引してきた教育組織であるペスタロッチ・フレーベルハウスの思想とナチズムとの関係を検討することにある。女性の社会的活躍の活路を幼児教育に見出した母性の論理は、ペスタロッチ・フレーベルハウスにおける子どもと家族を一体化させる思想を支えるものであった。幼児教育は家族に準じるものと位置付けられ、学校教育体系から切断された。これにより幼児教育は家族を賞賛するナチズムの論理とシームレスに接合していくこととなった。
## 4                           大学ランクや学部学科の専攻における男女差を分析した従来の研究は、大学ランクと専攻を別々に分析してきた。しかし、大学ランクや専攻、浪人という選択などの多様な変数を同時に考慮しなければ、大学進学とジェンダーの関係性はみえてこないのではないか。そこで本稿では多重対応分析を用いて、それらの変数間の「関係の網」を再構築する。その結果、人々の「合理的な選択」を促してジェンダー不平等を持続させる制度的文脈が明らかになる。
## 5                                           本稿は、代表性のある大規模な女性のライフヒストリー・データを用いて、出生コーホート別に年齢ごとの職業的地位を再構成する方法を紹介し、その手法によって蓄積してきた記述的な分析結果から、日本人女性のライフコースの長期的な変化を説明する。とくに戦時体制下の1940年代前半、1970年代半ばの石油ショック以後、1990年代半ば以降の「失われた10年」の3つの転換期に着目して、M字型の登場、定着、変容を検討している。
## 6                                      本稿は、プラグマティズムの中心概念の一つである「習慣(habit)」の観点から、ジェンダーを考察する。習慣というプラグマティズムの概念は、ジェンダーが私たちの身体的な存在を構成する構造であること理解させる。「かくれたカリキュラム」研究は、教室の中でセクシズムが伝えられていることを明らかにした。プラグマティズムの「習慣」概念は、セクシズムの克服のプロセスについて私たちの理解をさらに深めることに貢献する。

1.5 アブストと書誌情報を列結合する

jjer.abst <- dplyr::inner_join(doi, abst, by = "DOI")
head(jjer.abst)
##   Journal Year Volume Number Page             DOI Class Incld
## 1    JJER 2022     89      4  514 kyoiku.89.4_514  特集  収集
## 2    JJER 2022     89      4  526 kyoiku.89.4_526  特集  収集
## 3    JJER 2022     89      4  539 kyoiku.89.4_539  特集  収集
## 4    JJER 2022     89      4  552 kyoiku.89.4_552  特集  収集
## 5    JJER 2022     89      4  565 kyoiku.89.4_565  特集  収集
## 6    JJER 2022     89      4  579 kyoiku.89.4_579  特集  収集
##                JYVNP
## 1 JJER_2022_89_4_514
## 2 JJER_2022_89_4_526
## 3 JJER_2022_89_4_539
## 4 JJER_2022_89_4_552
## 5 JJER_2022_89_4_565
## 6 JJER_2022_89_4_579
##                                                                                                                                                                                                                                                                                                                                                                                                                                                   Abst
## 1                     男女の特性論は、明治初年、男女同権論と男尊女卑の両方を否定するものとして成立し、戦前の女子教育の主要な教育理念となった。特性論は戦後の男女共学制においても維持され、教育課程の男女格差は、男女の本質的平等を保障するための合理的な差異と見なされた。1985年の女性差別撤廃条約の批准とジェンダー論の普及により特性論は終焉するが、今日、男女を区別すること自体が「差別」と見なされる中で、女子教育の存在意義が改めて問われている。
## 2                                 少数派の親の意思をどのように位置づけるかという公私二元論問題抜きに性教育論争を理解することはできない。宗教が扱ってきた「性」、また近代社会が私的なことがらとした「性」を、公教育で積極的に扱うのが性教育だからだ。教育内容のみならず性教育の実施そのものに同意できない宗教関係者などからの批判が登場して性教育論争となる。本稿では、イギリス、アメリカおよび日本の性教育論争の特徴とこの論点への対処方法を整理した。
## 3 本研究は、ドイツの幼児教育界を牽引してきた教育組織であるペスタロッチ・フレーベルハウスの思想とナチズムとの関係を検討することにある。女性の社会的活躍の活路を幼児教育に見出した母性の論理は、ペスタロッチ・フレーベルハウスにおける子どもと家族を一体化させる思想を支えるものであった。幼児教育は家族に準じるものと位置付けられ、学校教育体系から切断された。これにより幼児教育は家族を賞賛するナチズムの論理とシームレスに接合していくこととなった。
## 4                           大学ランクや学部学科の専攻における男女差を分析した従来の研究は、大学ランクと専攻を別々に分析してきた。しかし、大学ランクや専攻、浪人という選択などの多様な変数を同時に考慮しなければ、大学進学とジェンダーの関係性はみえてこないのではないか。そこで本稿では多重対応分析を用いて、それらの変数間の「関係の網」を再構築する。その結果、人々の「合理的な選択」を促してジェンダー不平等を持続させる制度的文脈が明らかになる。
## 5                                           本稿は、代表性のある大規模な女性のライフヒストリー・データを用いて、出生コーホート別に年齢ごとの職業的地位を再構成する方法を紹介し、その手法によって蓄積してきた記述的な分析結果から、日本人女性のライフコースの長期的な変化を説明する。とくに戦時体制下の1940年代前半、1970年代半ばの石油ショック以後、1990年代半ば以降の「失われた10年」の3つの転換期に着目して、M字型の登場、定着、変容を検討している。
## 6                                      本稿は、プラグマティズムの中心概念の一つである「習慣(habit)」の観点から、ジェンダーを考察する。習慣というプラグマティズムの概念は、ジェンダーが私たちの身体的な存在を構成する構造であること理解させる。「かくれたカリキュラム」研究は、教室の中でセクシズムが伝えられていることを明らかにした。プラグマティズムの「習慣」概念は、セクシズムの克服のプロセスについて私たちの理解をさらに深めることに貢献する。
setwd("../Data")
write.csv(jjer.abst, "JJER_ABST.csv")

これでアブストを分析できるようになった