๐Ÿ“š ๊ฐ์ฒด ํƒ์ง€ ์†Œ๊ฐœ#

๊ฐ์ฒด ํƒ์ง€์™€ ์ปดํ“จํ„ฐ ๋น„์ „#

๊ฐ์ฒด ํƒ์ง€(Object Detection)๋Š” ์ด๋ฏธ์ง€๋‚˜ ๋™์˜์ƒ์—์„œ ํŠน์ • ๊ฐ์ฒด(๋“ค)์„ ์‹๋ณ„ํ•˜๊ณ , ์‹๋ณ„ํ•œ ๊ฐ์ฒด๊ฐ€ ์œ„์น˜ํ•œ ์˜์—ญ์„ ํ‘œ์‹œํ•˜๋Š” ์ปดํ“จํ„ฐ ๋น„์ „(Computer Vision) ์ž‘์—… ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ด ์นด๋ฉ”๋ผ๋ฅผ ๋“ค๊ณ  ํ™”๋ฉด์— ๋ณด์ด๋Š” ๋ฌผ์ฒด๋“ค์„ ์ฐพ์•„์„œ ํ‘œ์‹œํ•˜๊ณ , ๊ฐ ๋ฌผ์ฒด๋“ค์— ์ด๋ฆ„ํ‘œ๋ฅผ ๋ถ™์ด๋Š” ์ž‘์—…์„ ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋น„์œ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๊ฐ์ฒด ํƒ์ง€ ๊ธฐ์ˆ ์€ X-Ray๋‚˜ MRI, CT ์˜์ƒ ๋“ฑ์œผ๋กœ๋ถ€ํ„ฐ ๋ณ‘๋ณ€์„ ํƒ์ง€ํ•˜๋Š” ์˜๋ฃŒ ์˜์ƒ ๋ถ„์„ ๋˜๋Š” ๋„๋กœ ์œ„์˜ ์ฐจ๋Ÿ‰์ด๋‚˜ ๋ณดํ–‰์ž, ์‹ ํ˜ธ ๋“ฑ์„ ํƒ์ง€ํ•˜๋Š” ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ ๋“ฑ์— ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.


๊ฐ์ฒด ํƒ์ง€๋Š” ์ปดํ“จํ„ฐ ๋น„์ „์˜ ์—ฌ๋Ÿฌ ์‘์šฉ ๋ถ„์•ผ ์ค‘ ํ•˜๋‚˜๋กœ, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜(Classification)์™€ ์ด๋ฏธ์ง€ ์„ธ๋ถ„ํ™”(Segmentation)์™€ ๋ฐ€์ ‘ํ•œ ์—ฐ๊ด€์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฐ์ฒด ํƒ์ง€๋Š” ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋ฅผ ๋„˜์–ด ์—ฌ๋Ÿฌ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๊ณ  ๊ฐ ๊ฐ์ฒด์˜ ์œ„์น˜๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์ด๋ฏธ์ง€ ์„ธ๋ถ„ํ™”๋Š” ํƒ์ง€๋œ ๊ฐ์ฒด์˜ ๊ฒฝ๊ณ„๊นŒ์ง€ ์ •ํ™•ํžˆ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ์ž…๋ ฅ/์ถœ๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํ˜•ํƒœ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๊ฐ„๋‹จํžˆ ๊ฐ ์ž‘์—…์„ ๋น„๊ตํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

์ž‘์—…

์ •์˜

์ž…๋ ฅ ๋ฐ์ดํ„ฐ

์ถœ๋ ฅ ๋ฐ์ดํ„ฐ

์ฃผ์š” ํ™œ์šฉ ์‚ฌ๋ก€

์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ (Classification)

์ด๋ฏธ์ง€์—์„œ ํ•˜๋‚˜์˜ ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ์˜ˆ์ธก

๋‹จ์ผ ์ด๋ฏธ์ง€

๋‹จ์ผ ๋ผ๋ฒจ

์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰, ๋™๋ฌผ ์ข…๋ฅ˜ ๋ถ„๋ฅ˜

๊ฐ์ฒด ํƒ์ง€ (Object Detection)

์—ฌ๋Ÿฌ ๊ฐ์ฒด์˜ ์กด์žฌ ์—ฌ๋ถ€์™€ ์œ„์น˜๋ฅผ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋กœ ์˜ˆ์ธก

๋‹จ์ผ ์ด๋ฏธ์ง€

์—ฌ๋Ÿฌ ๋ผ๋ฒจ๊ณผ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค

์ž์œจ์ฃผํ–‰ ์ฐจ๋Ÿ‰, ๊ฐ์‹œ ์‹œ์Šคํ…œ

์ด๋ฏธ์ง€ ์„ธ๋ถ„ํ™” (Segmentation)

์ด๋ฏธ์ง€์˜ ๋ชจ๋“  ํ”ฝ์…€์„ ๊ฐ์ฒด ์˜์—ญ์œผ๋กœ ํ• ๋‹น

๋‹จ์ผ ์ด๋ฏธ์ง€

ํ”ฝ์…€ ๋‹จ์œ„ ๋งˆ์Šคํฌ

์˜๋ฃŒ ์˜์ƒ ๋ถ„์„, ์ž์œจ์ฃผํ–‰ ์ •๋ฐ€ ์ง€๋„ ์ƒ์„ฑ


๊ฐ ์ž‘์—…(Task)์„ ํ•œ ๋ฌธ์žฅ์œผ๋กœ ์ •๋ฆฌํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋Š” ๋‹จ์ˆœํžˆ โ€œ์ด ์ด๋ฏธ์ง€๋Š” ๋ฌด์—‡์ธ๊ฐ€?โ€๋ผ๋Š” ์งˆ๋ฌธ์— ๋‹ตํ•ฉ๋‹ˆ๋‹ค.

  • ๊ฐ์ฒด ํƒ์ง€๋Š” โ€œ๋ฌด์—‡์ด ์–ด๋””์— ์žˆ๋Š”๊ฐ€?โ€๋ผ๋Š” ์งˆ๋ฌธ์„ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค.

  • ์ด๋ฏธ์ง€ ์„ธ๋ถ„ํ™”๋Š” โ€œ๋ฌด์—‡์ด ์–ด๋””์— ์žˆ๋Š”๊ฐ€?โ€๋ผ๋Š” ์งˆ๋ฌธ์— ํ”ฝ์…€ ์ˆ˜์ค€์˜ ์ •๋ฐ€ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.


์ปดํ“จํ„ฐ ๋น„์ „(Computer Vision)๊ณผ ๊ด€๋ จํ•œ ๋” ๋‹ค์–‘ํ•œ ์ž‘์—…๋“ค์€ PapersWithCode ์‚ฌ์ดํŠธ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”:

PapersWithCode ์‚ฌ์ดํŠธ์˜ Browse State-of-the-Art ๋ฉ”๋‰ด

Fig. 1 ๋ฐ”๋กœ๊ฐ€๊ธฐ: https://paperswithcode.com/area/computer-vision#

Note

์ƒˆ๋กœ์šด ๋ถ„์•ผ์˜ ์—ฐ๊ตฌ๋‚˜ ๊ธฐ์ˆ ์„ ํƒ์ƒ‰ํ•  ๋•Œ, PapersWithCode ์‚ฌ์ดํŠธ๋Š” ๋งค์šฐ ์œ ์šฉํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ฃผ์š” ๋ถ„์•ผ๋“ค์— ๋Œ€ํ•œ ์ตœ์‹  ์—ฐ๊ตฌ ๋…ผ๋ฌธ๊ณผ ์ฝ”๋“œ, ๊ทธ๋ฆฌ๊ณ  ์„ฑ๋Šฅ ํ‰๊ฐ€ ์ง€ํ‘œ ๋“ฑ์„ ํ•œ๋ˆˆ์— ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐ์ฒด ํƒ์ง€ ๋žฉ ์†Œ๊ฐœ#

์ด๋ฒˆ ๊ฐ์ฒด ํƒ์ง€ ๋žฉ์—์„œ๋Š” PyTorch์˜ ์˜์ƒ์ฒ˜๋ฆฌ ํŠนํ™” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ(Domain API)์ธ torchvision์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. torchvision์„ ์‚ฌ์šฉํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ๋ถˆ๋Ÿฌ์˜ค๊ณ , ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋“ค์„ ์ฝ”๋“œ๋ฅผ ํ†ตํ•ด ๋ฐฐ์›Œ๋ด…๋‹ˆ๋‹ค. ์ดํ›„, ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ตํ˜€๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.