반도체 특허 심사 진행 상태 및 부품별 비율



<5> 부품별 상위 키워드 1개에 대한
3사의 5개년 심사진행상태 추이


1. 코드

예시


setwd('C:/Users/dnjs1/Downloads/Rr/')


rate<- function(x, y, z){
  b<-x %>% filter(grepl(y, 출원일자))
  a<-intersect(x %>% filter(grepl(y, 출원일자)), x %>% filter(grepl(z, 심사진행상태)))
  
  return(nrow(a)/nrow(b))
}



# display(crystal) 키워드 최근 5년(2022 ~ 2018) 심사진행상태 추이
# 등록결정=1, 거절결정=2, 포기=3, 취하=4
crys_lg<-read.csv("crys_lg.csv", header = T)
crys_sam<-read.csv("crys_sam.csv", header = T)
crys_sk<-read.csv("crys_sk.csv", header = T)

# 결측치 제거
crys_lg <- crys_lg[!(crys_lg$심사진행상태 == "" ), ]
crys_sam <- crys_sam[!(crys_sam$심사진행상태 == "" ), ]
crys_sk <- crys_sk[!(crys_sk$심사진행상태 == "" ), ]


# 등록결정
crys_l_2022_1<-rate(crys_lg, 2022, '등록결정')
crys_l_2021_1<-rate(crys_lg, 2021, '등록결정')
crys_l_2020_1<-rate(crys_lg, 2020, '등록결정')
crys_l_2019_1<-rate(crys_lg, 2019, '등록결정')
crys_l_2018_1<-rate(crys_lg, 2018, '등록결정')

#거절결정
crys_l_2022_2<-rate(crys_lg, 2022, '거절결정')
crys_l_2021_2<-rate(crys_lg, 2021, '거절결정')
crys_l_2020_2<-rate(crys_lg, 2020, '거절결정')
crys_l_2019_2<-rate(crys_lg, 2019, '거절결정')
crys_l_2018_2<-rate(crys_lg, 2018, '거절결정')

# 포기
crys_l_2022_3<-rate(crys_lg, 2022, '포기')
crys_l_2021_3<-rate(crys_lg, 2021, '포기')
crys_l_2020_3<-rate(crys_lg, 2020, '포기')
crys_l_2019_3<-rate(crys_lg, 2019, '포기')
crys_l_2018_3<-rate(crys_lg, 2018, '포기')

# 취하
crys_l_2022_4<-rate(crys_lg, 2022, '취하')
crys_l_2021_4<-rate(crys_lg, 2021, '취하')
crys_l_2020_4<-rate(crys_lg, 2020, '취하')
crys_l_2019_4<-rate(crys_lg, 2019, '취하')
crys_l_2018_4<-rate(crys_lg, 2018, '취하')
crys_l<-data.frame('심사진행상태'=c('등록결정','등록결정','등록결정','등록결정','등록결정','거절결정', '거절결정', '거절결정', '거절결정', '거절결정','포기','포기','포기','포기','포기','취하','취하','취하','취하','취하'),
                   '연도'=c(2022,2021,2020,2019,2018,2022,2021,2020,2019,2018,2022,2021,2020,2019,2018,2022,2021,2020,2019,2018),
                   '비율'= c(crys_l_2022_1,crys_l_2021_1,crys_l_2020_1,crys_l_2019_1,crys_l_2018_1,crys_l_2022_2,crys_l_2021_2,crys_l_2020_2,crys_l_2019_2,crys_l_2018_2,crys_l_2022_3,crys_l_2021_3,crys_l_2020_3,crys_l_2019_3,crys_l_2018_3,crys_l_2022_4,crys_l_2021_4,crys_l_2020_4,crys_l_2019_4,crys_l_2018_4))


그래프 코드

win.graph(15,10)
g1 <- ggplot(data=crys_l, aes(x=연도,y=비율,group=심사진행상태,color=심사진행상태))+ geom_line(size=1.3) + geom_point(size=4) +
 geom_point(size=2.5, color='#FFFFFF') + labs(title='LG crystal 관련 특허 최근 5년 심사진행상태')




2. 3사 crystal 관련 특허


display 관련 공통 최상위 키워드 ‘crystal’ 에 대한
3사의 5개년(2022 ~ 2018) 심사진행상태 추이





3. 3사 oled 관련 특허


led 관련 공통 최상위 키워드 ‘oled’ 에 대한
3사의 5개년(2022 ~ 2018) 심사진행상태 추이





4. 3사 sram 관련 특허


ram 관련 공통 최상위 키워드 ‘sram’ 에 대한
3사의 5개년(2022 ~ 2018) 심사진행상태 추이





5. 3사 panel 관련 특허


transistor 관련 공통 최상위 키워드 ‘panel’ 에 대한
3사의 5개년(2022 ~ 2018) 심사진행상태 추이







<6> 특허 심사 진행 상태


1. 코드

예시

#데이터 불러오기 및 전처리
display_lg <- read.csv("C:/Users/dnjs1/Downloads/Rr/display(LG).csv", header=T)
display_lg <- display_lg[!(display_lg$심사진행상태 == ""), ]
display_lg$심사진행상태 <- gsub("\\(.*?\\)","",display_lg$심사진행상태)
#등록결정/거절결정/포기/취하(심사미청구)/기타=원결정유지

display_lg$심사진행상태 <- substr(display_lg$심사진행상태, 1, 5)
display_lg$심사진행상태 <- str_trim(display_lg$심사진행상태)

#각 항목별 개수 파악 (등록결정=1, 거절결정=2, 포기=3, 취하=4, 기타=5(원결정유지) )
display_lg_1 <- nrow(display_lg[display_lg$심사진행상태 == "등록결정",])
display_lg_1 <- nrow(display_lg[display_lg$심사진행상태 == "등록결정",])
display_lg_2 <- nrow(display_lg[display_lg$심사진행상태 == "거절결정",])
display_lg_3 <- nrow(display_lg[display_lg$심사진행상태 == "포기",])
display_lg_4 <- nrow(display_lg[display_lg$심사진행상태 == "취하",])
display_lg_5 <- nrow(display_lg[display_lg$심사진행상태 == "원결정유지",])
display_lg <- nrow(display_lg)

#lg사 display 관련 특허건 개수
display_lg #39209 #lg사 display 관련 특허 건 수
display_lg_1 #26915 #lg사 display 관련 특허 중 등록결정 건 개수 (재심사 후 등록결정건 포함)
display_lg_2 #2996 #lg사 display 관련 특허 중 거절결정 건 개수(거절결정 후 재심사중인 건 포함)
display_lg_3 #54 #lg사 display 관련 특허 중 포기(미납) 건 개수
display_lg_4 #8755 #lg사 display 관련 특허 중 취하(심사미청구) 건 개수
display_lg_5 #422 #lg사 display 관련 특허 중 원결정유지 건 개수

#lg사 display 관련 특허건 비율
display_lg_1_per <- display_lg_1 / display_lg 
display_lg_2_per <- display_lg_2 / display_lg
display_lg_3_per <- display_lg_3 / display_lg 
display_lg_4_per <- display_lg_4 / display_lg 
display_lg_5_per <- display_lg_5 / display_lg #원결정유지건은 제외
display_lg_1_per #0.6864495
display_lg_2_per #0.07641103
display_lg_3_per #0.001377235
display_lg_4_per #0.2232906

#lg사 display 관련 특허건
display_lg <- data.frame("심사진행상태"=c("등록결정","거절결정","포기","취하"),
                         "비율"=c(display_lg_1_per,display_lg_2_per,display_lg_3_per,display_lg_4_per))


그래프 코드

d_l = ggplot(display_lg, aes(x=심사진행상태, y=비율, fill=심사진행상태))+
       geom_bar(mapping=aes(fill=심사진행상태),stat = "identity")+
       geom_label(aes(label=round(비율,3),nudge_y = 1.1)) +
       labs(title = "LG사 display 관련 특허건 비율")




2. LG




3. SAMSUNG




4. SK




5. 특허 심사진행 상태 비율







<7> 최근 5개년
기업별 반도체 특허 심사진행상태 비율


1. 코드

예시

rm(list=ls()) 
setwd("C:/Users/dnjs1/Downloads/Rr/")

##LG Display
#데이터 불러오기 및 전처리
display_lg <- read.csv("display(LG).csv", header=T)
display_lg <- display_lg[!(display_lg$심사진행상태 == ""), ]
display_lg$심사진행상태 <- gsub("\\(.*?\\)","",display_lg$심사진행상태)
#등록결정/거절결정/포기/취하(심사미청구)/기타=원결정유지

display_lg$심사진행상태 <- substr(display_lg$심사진행상태, 1, 5)
display_lg$심사진행상태 <- str_trim(display_lg$심사진행상태)

#nrow 빼기
#각 항목별로 분류 (등록결정=1, 거절결정=2, 포기=3, 취하=4, 기타=5(원결정유지) )
display_lg_1 <- display_lg[display_lg$심사진행상태 == "등록결정",]
display_lg_2 <- display_lg[display_lg$심사진행상태 == "거절결정",]
display_lg_3 <- display_lg[display_lg$심사진행상태 == "포기",]
display_lg_4 <- display_lg[display_lg$심사진행상태 == "취하",]
display_lg_5 <- display_lg[display_lg$심사진행상태 == "원결정유지",]

#lg display 1등록결정 특허의 연도별 추세 
display_lg_1 <- display_lg[display_lg$심사진행상태 == "등록결정",]
display_lg_1 <- display_lg_1[,3:4] #연도부분만 남기기
#출원일자에서 앞의 4글자만 남기고 지우기
display_lg_1$출원일자 <- substr(display_lg_1$출원일자, 1, 4)
display_lg_1_18 <- nrow(display_lg_1[display_lg_1$출원일자 == "2018",])
display_lg_1_19 <- nrow(display_lg_1[display_lg_1$출원일자 == "2019",])
display_lg_1_20 <- nrow(display_lg_1[display_lg_1$출원일자 == "2020",])
display_lg_1_21 <- nrow(display_lg_1[display_lg_1$출원일자 == "2021",])
display_lg_1_22 <- nrow(display_lg_1[display_lg_1$출원일자 == "2022",])
display_lg_1_18 #291
display_lg_1_19 #163
display_lg_1_20 #146
display_lg_1_21 #52
display_lg_1_22 #45
#해당 연도의 총 특허 수
display_lg$출원일자 <- substr(display_lg$출원일자, 1, 4)
display_lg_18 <- nrow(display_lg[display_lg$출원일자 == "2018",])
display_lg_19 <- nrow(display_lg[display_lg$출원일자 == "2019",])
display_lg_20 <- nrow(display_lg[display_lg$출원일자 == "2020",])
display_lg_21 <- nrow(display_lg[display_lg$출원일자 == "2021",])
display_lg_22 <- nrow(display_lg[display_lg$출원일자 == "2022",])
display_lg_18 #389
display_lg_19 #196
display_lg_20 #155
display_lg_21 #59
display_lg_22 #51
#lg사 display 관련 특허건 비율
#1 등록결정
dis_lg_1_18_per <- display_lg_1_18/display_lg_18
dis_lg_1_19_per <- display_lg_1_19/display_lg_19
dis_lg_1_20_per <- display_lg_1_20/display_lg_20
dis_lg_1_21_per <- display_lg_1_21/display_lg_21
dis_lg_1_22_per <- display_lg_1_22/display_lg_22
dis_lg_1_18_per
dis_lg_1_19_per
dis_lg_1_20_per
dis_lg_1_21_per
dis_lg_1_22_per


그래프 코드

#lg사 display 관련 특허건
display_lg__ <- data.frame("심사진행상태"=c("등록결정","등록결정","등록결정","등록결정","등록결정"),
                           "연도"=c("2018","2019","2020","2021","2022"),
                           "비율"=c(dis_lg_1_18_per,dis_lg_1_19_per,dis_lg_1_20_per,dis_lg_1_21_per,dis_lg_1_22_per
                                  ))
display_lg__


##그래프


d_l = ggplot(data=display_lg__, aes(x=연도,y=비율,group=심사진행상태,color=심사진행상태))+
  geom_line(size=1.3)+
  geom_point(size=4)+
  geom_point(size=2.5,color='#FFFFFF')+
  scale_y_break(c(0.225, 0.725)) +
  labs(title = "최근 5개년 LG사 display 관련 특허 심사진행상태 비율")




2. LG





3. Samsung





4. SK







<8> 각 부품별 기업의 특허 개수 비율


1. 코드

예시

##Display
#데이터 불러오기 및 전처리
display_lg <- read.csv("C:/Users/dnjs1/Downloads/Rr/display(LG).csv", header=T)
display_lg <- nrow(display_lg)
display_samsung <- read.csv("C:/Users/dnjs1/Downloads/Rr/display_samsung.csv", header=T)
display_samsung <- nrow(display_samsung)
display_sk <- read.csv("C:/Users/dnjs1/Downloads/Rr/skdisplay.csv", header=T, fileEncoding="euc-kr")
display_sk <- nrow(display_sk)
display_all <- sum(display_lg,display_samsung,display_sk)
#비율
display_lg <- display_lg/display_all
display_samsung <- display_samsung/display_all
display_sk <- display_sk/display_all

display <- data.frame("기업"=c("LG","SAMSUNG","SK"),
                      "퍼센트"=c(display_lg*100,display_samsung*100,display_sk*100))


그래프 코드

dis = ggplot(display, aes(x = '', y = 퍼센트, fill = 기업)) +
       geom_bar(width=0.5, stat = "identity", color="white") +
       coord_polar("y",start=1)+
       geom_text(aes(label = paste0(round(퍼센트,2),"%")),
                 position = position_stack(vjust = 0.5))+
       theme_void()+
       labs(title = "Display 관련 특허 내 각 기업 비율")




2. 각 부품별 기업 특허 개수 비율

  • Display : SAMSUNG > LG > SK

  • RAM : SAMSUNG > SK > LG

  • LED : SAMSUNG > LG > SK

  • Transistor : SAMSUNG > LG > SK




ⓒ Statistical Methods, Gachon University