빅데이터분석론 중간고사(2023년 2학기)

R-코드를 제출하시오. 파일명은 “이름_학번”으로 하시오. 설명은 주석을 이용하시오. 그리고 프로그램이 실행되지 않으면, 점수가 없습니다. 반드시 확인해보세요. 자료는 코드와 동일한 폴더에 넣고 작업하시오. 작성된 답안 스크립트는 bigdata1437@gmail.com 으로 보내시오. 퇴실하기 전에 이메일이 잘 제출되었는지 반드시 확인하시오.

Question 1 (30점)

  1. (5점) 1에서 100까지 프린트 하는 for 루프를 짜시오.

  2. (10점) 위의 예에서 3의 배수인 경우 “3의 배수”라고 표시하시오.

  3. (15점) 위의 예에서 3의 배수인 경우 “3의 배수”, 5의 배수인 경우 “5의 배수”, 동시에 3과 5의 배수인 경우 “3,5의 공배수”라고 표시하시오.

Question 2 (30점)

  1. (5점) ‘fertility.xlsx’ 자료를 읽어들이시오.

  2. (10점) 연도 값을 이용하여 tidy 데이터로 전환하시오. ’세종특별자치시’에 대한 관측치는 제외하시오. 필요한 라이브러리를 장착하시오.

  3. (15점) 출산율의 분포가 연도별로 어떻게 변하는지 그리시오.

Question 3 (40점)

  1. (5점) “unemployment.csv”을 적절한 library와 함수를 사용하여 읽어 들이시오.

  2. (5점) 위에서 읽어 들인 자료 중 unemp 변수는 실업자의 실업기간(월)을 나타낸다. 평균 실업기간과 표준편차를 구하고, 히스토그램을 그리시오.

  3. (15점) 다음과 같은 mlsum(a) 함수를 만드시오.

    • a를 함수의 인수(argument)를 받는다.

    • 각 관측치마다 \(a \exp(-a t)\)를 계산한다. \(t\) 는 실업기간(unemp)을 나타낸다.

    • 위에서 계산한 값에 \(\log\) 변환을 취한다.

    • 모든 관측치에 대해서 합한다.

    • 위에서 합한 값을 return 한다.

  4. (15점) 다음과 같은 과정을 통해 그림을 그리시오.

    • 0에서 2사이의 0.05씩 간격으로 수열을 만드시오(\(x\)). 그리고 dataframe 형태로 저장하시오.

    • 위에서 만든 값을 mlsum()에 대입해서 새로운 값을 만드시오( \(y\) ).

    • 가로축을 \(x\), 세로축을 \(y\) 로 하는 선 그래프를 ggplot2를 이용해서 그리시오.

    • \(x\) 가 어떤 값일 때, \(y\) 가 최소가 되는지 파악해보시오.