투자 일상 기록

AI가 스스로 만들어내는 합성데이터의 비밀 - 티타임즈TV

샬롯의 투자일지 2022. 8. 10. 08:30
728x90

안녕하세요, 샬롯의 투자 일지입니다.

일주일 동안 보고, 들었던 콘텐츠 중에서 인상 깊었던 내용을 요약하여 공유드려요! 😉

자세한 내용은 원문을 참고해 주세요!

AI가 스스로 만들어내는 합성데이터의 비밀

유튜브: 티타임즈TV

1. AI 성능의 필수 요소 데이터

- 초거대 AI, 구글 람다. 질 좋은 데이터가 필요한 이유는 여기서도 데이터가 다 라벨링이 되어 있어야 하기 때문.

- 다양한 데이터를 편향되지 않게 잘 수집하는 것이 중요.

 

2. 합성 데이터가 필요한 이유

- 초거대 AI라고 하더라도 데이터 수집과 모델링 필요.

- 합성데이터를 통해서 편향되지 않게 모델링도 가능. 따라서 적은 데이터로 충분한 결과 낼 수 있음.

 

3. AI가 편향된 결과물을 내놓지 않으려면

- MS 인공지능 테이, 편향되어 있었음. 모아진 데이터가 안 좋으면 편향된 결과를 낼 수밖에 없음.

 

4. 사진, 영상 합성데이터를 만드는 방법

- 사진 여러 장으로 영상 합성 데이터 만들 수 있음. 데이터세트로 만들어서 판매도 가능. 예를 들면, 나이 든 사진을 추측하는 AI를 모델링 할 수도 있음.

 

5. AI 개발하는 회사는 데이터를 어떻게 모으나

- 플랫폼 외의 회사들은 데이터 잘 모을 수 없음.

- 오픈 데이터 셋을 활용할 수 있음. 표준화된 데이터세트를 가지고 모델링 가능.

- 성능은 라벨이 되어 있는 데이터가 좋아서 이런 데이터를 수집하는 업체도 있음.

 

6. 합성데이터를 만드는 글로벌 기업

- 해외에서는 AI리버리, 인스타카트 등 회사.

- AI리버리는 산불 데이터로 예측.

- 케이퍼AI를 인수한 인스타카트는 3D스캐너 같은 기능. 360도로 돌려볼 수 있는 사진 또는 영상 보여주는 것.

 

7. 합성데이터의 분야별 장단점

- 합성데이터는 AI가 만든 모든 데이터를 뜻함.

- 2D 데이터는 기존 AI 모델의 성능이 좋지만, 초반 데이터 필요.

- 3D 데이터는 기존 AI 모델의 성능 좋게 만들 수는 없음. 대신 초반에 데이터 없이 바로 구현 가능.

 

8. 합성데이터는 누가 만드나?

- 합성데이터도 AI가 만든다.


-> 의견: 투자 아이디어로 활용하면 좋을 것 같습니다.

 

728x90