U E D R , A S I H C RSS

정모/2022.05.12

Difference between r1.2 and the current

@@ -1,41 +1,44 @@
'''2022.05.11 입니다'''
[[TableOfContents]]

= OMS =
* [임지민] 학우님 : 컴퓨터는 객체를 어떻게 탐지할까?
* [김동영] 학우님 : 컴퓨터는 객체를 어떻게 탐지할까?
* 다음 주자: [이민욱] 학우님

== 내용 ==
== 객체 탐지? ==
* 컴퓨터 비전 분야에서 흔히 object detection이라고 불림
* 오래 전부터 연구되어 온 주제이며, 2012년 alexnet이란 딥러닝 네트워크가 등장하기 전까지도 많은 방법이 시도되어 왔음
* 이번 발표는 딥러닝 이후, 즉 r-cnn 이후를 중심으로 다룰 예정임
* 컴퓨터 비전 분야에서 흔히 object detection이라고 불림
* 오래 전부터 연구되어 온 주제이며, 2012년 alexnet이란 딥러닝 네트워크가 등장하기 전까지도 많은 방법이 시도되어 왔음
* 이번 발표는 딥러닝 이후, 즉 r-cnn 이후를 중심으로 다룰 예정임

== 이미지 분류 ==
* 컴퓨터 비전의 가장 중요한 작업은, 당연하게도 이미지를 분류하는 작업이고, 객체 탐지 또한 이미지 분류 문제를 포함함
* 이미지 인식의 문제는 영상의 다양성에서 비롯됨. 사진이 찍힌 위치, 빛, 자세 등에 따라 컴퓨터는 같은 종류의 이미지를 아주 다르게 인식함
* 이를 해결하기 위해 데이터 기반의 방법론이 등장함. 가장 대표적인 것이 kNN 분류기이고, 이 분류기는 각각의 test 데이터의 주변에 어떤 클래스의 train 데이터가 가장 많은지를 판단해서 분류함. - 직관적인 분류기
* kNN보다 조금 더 효율적인 svm은, 데이터를 기반으로 선형 분류기를 만드는 방법임 (기본적으로 svm은 이진 분류기임)
* 다만 위의 두 방법 모두 raw-pixel을 사용하기 때문에 성능은 둘 다 그렇게 좋지 못함
* 컴퓨터 비전의 가장 중요한 작업은, 당연하게도 이미지를 분류하는 작업이고, 객체 탐지 또한 이미지 분류 문제를 포함함
* 이미지 인식의 문제는 영상의 다양성에서 비롯됨. 사진이 찍힌 위치, 빛, 자세 등에 따라 컴퓨터는 같은 종류의 이미지를 아주 다르게 인식함
* 이를 해결하기 위해 데이터 기반의 방법론이 등장함. 가장 대표적인 것이 kNN 분류기이고, 이 분류기는 각각의 test 데이터의 주변에 어떤 클래스의 train 데이터가 가장 많은지를 판단해서 분류함. - 직관적인 분류기
* kNN보다 조금 더 효율적인 svm은, 데이터를 기반으로 선형 분류기를 만드는 방법임 (기본적으로 svm은 이진 분류기임)
* 다만 위의 두 방법 모두 raw-pixel을 사용하기 때문에 성능은 둘 다 그렇게 좋지 못함

== 특징 추출 ==
* 그래서, 분류 이전에 그 이미지의 특징을 추출하는 작업이 선행되어야 함. 딥러닝 이전에는 이미지의 gradient를 사용해 특징을 추출하기도 했음.
* 딥러닝 또한 결국은 특징을 추출하는 네트워크임. 이미지가 들어오면 특징 벡터를 출력하는 변환기, 또는 함수라고 봐야 함.
* 이미지 분류에서 좋은 성능을 보이는 딥러닝 네트워크인 cnn이 등장한 후, 이를 어떻게 객체 탐지로 일반화시킬 수 있을지에 대한 연구가 이어짐. 그 과정에서 최초로 나온 논문이 r-cnn이고, 머신러닝 기법과 딥러닝 기법을 동시에 활용해 객체를 탐지하는 방법을 제시함.
* 그래서, 분류 이전에 그 이미지의 특징을 추출하는 작업이 선행되어야 함. 딥러닝 이전에는 이미지의 gradient를 사용해 특징을 추출하기도 했음.
* 딥러닝 또한 결국은 특징을 추출하는 네트워크임. 이미지가 들어오면 특징 벡터를 출력하는 변환기, 또는 함수라고 봐야 함.
* 이미지 분류에서 좋은 성능을 보이는 딥러닝 네트워크인 cnn이 등장한 후, 이를 어떻게 객체 탐지로 일반화시킬 수 있을지에 대한 연구가 이어짐. 그 과정에서 최초로 나온 논문이 r-cnn이고, 머신러닝 기법과 딥러닝 기법을 동시에 활용해 객체를 탐지하는 방법을 제시함.

== 객체 탐지 ==
* 객체 탐지에서 수행해야 할 작업은 결국 두 가지임.
* 객체 탐지에서 수행해야 할 작업은 결국 두 가지임.
* 객체의 위치를 잡고,
* 그 위치의 객체가 무엇인지 판단
* 위에서 계속 분류에 대한 이야기를 했으니, 이제 객체의 위치만 나오면 그 부분만 짤라서 cnn에 넣으면 특징 벡터가 나오고, 그럼 svm이든 kNN이든 분류기를 사용해 분류하면 됨
* 남은 건 객체가 어디있는지 찾는 문제이고, selective search나 sliding window 방법을 사용하면 해결할 수 있음.
* 그리고 2000개의 roi(regoin of interest) 중 괜찮은 것들로만 추리는 작업(non maximum suppression)이 이뤄지면 정말 끝임
* 위에서 계속 분류에 대한 이야기를 했으니, 이제 객체의 위치만 나오면 그 부분만 짤라서 cnn에 넣으면 특징 벡터가 나오고, 그럼 svm이든 kNN이든 분류기를 사용해 분류하면 됨
* 남은 건 객체가 어디있는지 찾는 문제이고, selective search나 sliding window 방법을 사용하면 해결할 수 있음.
* 그리고 2000개의 roi(regoin of interest) 중 괜찮은 것들로만 추리는 작업(non maximum suppression)이 이뤄지면 정말 끝임

== 정리 ==
1. 객체가 있을 법한 곳을 찾고
2. 지정된 부분들만을 잘라서 분류하고
3. 그 중 좋은 것들로만 추려낸다
* 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
* 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)
1. 객체가 있을 법한 곳을 찾고
2. 지정된 부분들만을 잘라서 분류하고
3. 그 중 좋은 것들로만 추려낸다
 
* 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
* 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)

= 스터디 진행상황 보고 =
[안자구뭐해]
@@ -46,14 +49,7 @@
[코하자]

= 참여자 =
[김도엽], [임지민], [정우현], [최민준], [김동욱], [김은솔], [방석현], [이민욱] 
 
= 2022 카톡방 =
이번 주말내로 개설
 
= 삼성디지털/IT학회 연계 프로그램 =
추가 내용 전달되는대로 해줄 예정
[김도엽], [김동영], [방석현], [이민욱], [이승찬], [임지민], [채승운], [최민준], [한성민]

= 댓글 =

Describe 정모/2022.05.12 here



2022.05.11 입니다



1. OMS

  • 김동영 학우님 : 컴퓨터는 객체를 어떻게 탐지할까?

1.1. 내용

1.2. 객체 탐지?

  • 컴퓨터 비전 분야에서 흔히 object detection이라고 불림
  • 오래 전부터 연구되어 온 주제이며, 2012년 alexnet이란 딥러닝 네트워크가 등장하기 전까지도 많은 방법이 시도되어 왔음
  • 이번 발표는 딥러닝 이후, 즉 r-cnn 이후를 중심으로 다룰 예정임

1.3. 이미지 분류

  • 컴퓨터 비전의 가장 중요한 작업은, 당연하게도 이미지를 분류하는 작업이고, 객체 탐지 또한 이미지 분류 문제를 포함함
  • 이미지 인식의 문제는 영상의 다양성에서 비롯됨. 사진이 찍힌 위치, 빛, 자세 등에 따라 컴퓨터는 같은 종류의 이미지를 아주 다르게 인식함
  • 이를 해결하기 위해 데이터 기반의 방법론이 등장함. 가장 대표적인 것이 kNN 분류기이고, 이 분류기는 각각의 test 데이터의 주변에 어떤 클래스의 train 데이터가 가장 많은지를 판단해서 분류함. - 직관적인 분류기
  • kNN보다 조금 더 효율적인 svm은, 데이터를 기반으로 선형 분류기를 만드는 방법임 (기본적으로 svm은 이진 분류기임)
  • 다만 위의 두 방법 모두 raw-pixel을 사용하기 때문에 성능은 둘 다 그렇게 좋지 못함

1.4. 특징 추출

  • 그래서, 분류 이전에 그 이미지의 특징을 추출하는 작업이 선행되어야 함. 딥러닝 이전에는 이미지의 gradient를 사용해 특징을 추출하기도 했음.
  • 딥러닝 또한 결국은 특징을 추출하는 네트워크임. 이미지가 들어오면 특징 벡터를 출력하는 변환기, 또는 함수라고 봐야 함.
  • 이미지 분류에서 좋은 성능을 보이는 딥러닝 네트워크인 cnn이 등장한 후, 이를 어떻게 객체 탐지로 일반화시킬 수 있을지에 대한 연구가 이어짐. 그 과정에서 최초로 나온 논문이 r-cnn이고, 머신러닝 기법과 딥러닝 기법을 동시에 활용해 객체를 탐지하는 방법을 제시함.

1.5. 객체 탐지

  • 객체 탐지에서 수행해야 할 작업은 결국 두 가지임.
    • 객체의 위치를 잡고,
    • 그 위치의 객체가 무엇인지 판단
  • 위에서 계속 분류에 대한 이야기를 했으니, 이제 객체의 위치만 나오면 그 부분만 짤라서 cnn에 넣으면 특징 벡터가 나오고, 그럼 svm이든 kNN이든 분류기를 사용해 분류하면 됨
  • 남은 건 객체가 어디있는지 찾는 문제이고, selective search나 sliding window 방법을 사용하면 해결할 수 있음.
  • 그리고 2000개의 roi(regoin of interest) 중 괜찮은 것들로만 추리는 작업(non maximum suppression)이 이뤄지면 정말 끝임

1.6. 정리

  1. 객체가 있을 법한 곳을 찾고
  2. 지정된 부분들만을 잘라서 분류하고
  3. 그 중 좋은 것들로만 추려낸다
 
  • 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
  • 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)

2. 스터디 진행상황 보고

4. 댓글


Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2022-05-23 12:25:57
Processing time 0.0488 sec