본문 바로가기

NLP/AI 도서 및 기사

[AI 기사] 10월 둘째주 기사 요약

 

먼저 양질의 기사를 제공하는 'AI 타임스'에게 감사를 전합니다.

 


 

문화영역

 

 

“AI도 작가 의도 표현하는 도구” - AI타임스

최근 동대문디자인플라자(DDP)에서 열린 \'잘 알아듣지못했어요, 다시 한번 말씀해주세요\'라는 이색 전시회가 화제가 됐다. 난해하기로 유명한 이상의 시와 네덜란드 초현실주의 시인 폴 반오스

www.aitimes.com

 

  • 동대문디자인플라자(DDP)에서 열린 '잘 알아듣지못했어요, 다시 한번 말씀해주세요'라는 전시회.
  • 난해하기로 유명한 '이상'의 시와 네덜란드 시인 '폴 반오스타이예'의 시를 AI 로 학습시킨 결과물을 전시함.
  • 그림을 보고 무슨 물감과 붓을 썼냐고 묻지 않듯이, AI 는 도구에 불과하니 너무 주목하지 않길 바라심.

 

 

 

첫 AI 오디오 드라마 등장, '어서 오세요, 휴남동 서점입니다' - AI타임스

인공지능(AI) 보이스가 배우로 등장하고 AI 음악창작 기술로 OST를 만드는 \'AI 오디오 드라마\' 시대가 열린다.지니뮤직(대표이사 박현진)과 밀리의서재(대표이사 서영택)는 AI 기술을 접목한 오디

www.aitimes.com

 

  • AI 를 통해 오디오 드라마를 밀리의 서재와 지니뮤직이 함께 제작함.
  • 작곡 및 편곡, 배우 등을 AI 가 맡게 됨.
  • 밀리의 서재에서 볼 수 있음.

 

AI가 가장 늦게, 혹은 절대 닿지 못할 영역이 문화/예술이라고 생각했다. 하지만 봐라, 지금 가장 대중들의 눈을 사로잡는 기술은 놀랍게도 '문화/예술'이다. AI가 들어서면서, 여태껏 생각해보지 못했던 문제들이 생겨나고 있다. 나는 이 과정이 재밌고, 이 시대를 살아갈 수 있음에 감사하다.

 


세계 경제 영역

 

 

테슬라, '옵티머스' 출시 3~5년 뒤로 연기 - AI타임스

일런 머스크 테슬라 CEO가 말했던 \'매우 놀랄 일\'은 벌어지지 않았다.단지 손을 움직이고 앞으로 걸어나온 것이 전부였다. 이마저도 전선과 연결장치 등 내부를 그대로 드러낸 형태였다. 외형을

www.aitimes.com

 

  • 인간형 로봇 '옵티머스'는 놀랍지 않았다.
  • 3~5년 뒤로 연기되었다.
  • 자동차처럼 생산하며, 그에 준하거나 낮은 가격으로 생산될 예정이다.

 

저 기사를 보고, 테슬라의 주가를 예측하거나 아직 멀었다 일론 머스크 사기꾼 등의 반응을 보여선 안된다. 인류의 위대한 도약엔 저런 과정이 늘 있었다. 저런 시도 자체가 놀랍고 5년 뒤의 세상은 지금과 완전히 다를 수 있음을 예고한다. 정말, 로봇이 우리 주변에 공기처럼 놓이는 날이 머지 않았다고 본다.

 

 

 

팀 쿡 "메타버스 개념 모호...AR이 미래 주도할 것" - AI타임스

팀 쿡 애플 최고경영자(CEO)가 메타버스에 대해 부정적인 평가를 내놓았다. 대신 증강현실(AR)이 미래를 주도할 기술이라고 강조했다.CNBC는 쿡 CEO가 지난달 30일(이하 현지시간) 유럽 순방 중 네덜

www.aitimes.com

 

  • 메타버스가 아니라 'AR'이다.
  • 구글 CEO도 메타버스에 대한 정확한 합의가 없다고 지적함.
  • 스마트폰 없던 시절을 상상할 수 없듯이 'AR'도 그렇게 될 것이다.

 

어느 정도 동감한다. 하지만 AR 역시 사람들에게 설득력이 없다면 가차없이 무너질 것이다. 여기서 말하는 '설득력'이란 사람들이 현실과 구분하기 어려울 정도의 그래픽을 말한다. 메타버스를 대부분 게임 같다고 말한다. 그 이유는 몰입되지 않기 때문이다. 하지만 반대로 몰입이 가능할 정도의 수준이 온다면, 그때는 모든 흐름이 메타버스로 흐를 것이다 AR, VR 도 마찬가지다. 단지, '설득력'에 달린 문제가 아닐까 한다.

 

 


최신 기술 영역

 

 

메타, AI 비디오 생성기 ‘메이커비디오’ 공개 - AI타임스

메타가 텍스트 또는 이미지 프롬프트에서 새로운 비디오 콘텐츠를 생성할 수 있는 AI 기반 비디오 생성기 ‘메이커비디오(Make-A-Video)’를 29일(현지시간) 블로그에 공개했다.메타는 \'폭우 속을

www.aitimes.com

 

  • AI 기반 비디오 생성기 - 메타 '메이커비디오'
  • 텍스트 또는 이미지 프롬프트에서 새로운 비디오 콘텐츠를 생성
  • 사진 생성처럼 비디오 생성이 악용될 수 있다는 점을 인정하여 워터마크를 넣을 예정

 

 

명령만 하면 AI가 영화도 만들어 준다고? - AI타임스

시나리오처럼 긴 텍스트 명령어를 입력하면 이를 계속 이어서 생성해 마치 영화와 같은 장편 영상물까지 만들어 주는 인공지능(AI) 모델이 등장했다.구글이 이가튼 성능을 지닌 AI 시스템 \'이마

www.aitimes.com

  • AI 기반 비디오 생성기 - 구글 '이마젠 비디오(Imagen Video)', '페나키(Phenaki)'
  • 이마젠 비디오: 고화질, 페나키: 길고 자세한 설명 기반의 장편 영상
  • 메타의 대항마

 

이제 막 'text-to-image'의 시대가 도래했다고 생각했는데, 'text-to-video'의 시대가 이렇게 열릴 줄이야. 물론, 공개된 것은 아니나 결과물만 봐도 그 수준을 알 수 있다. 특히, 구글 '페나키'의 성능은 놀랍기만 하다. 어쩌면, 프롬프트 강의가 열릴 것만 같은 이 기분은 뭘까. 이 기술들이 사회에 어떤 영향을 미칠지 지켜봐야겠다. 또, 나도 자연어처리의 기초를 닦은 후에는 컴퓨터비전 분야에도 꾸준한 관심과 공부가 필요하다고 느꼈다.

 

 

 

 

구글, 다국어 언어 이미지 모델 ‘PaLI’ 공개 - AI타임스

주어진 이미지에 대해 설명하거나 질문에 답변하는 새로운 인공지능(AI) 언어 이미지 모델이 나왔다.구글은 100개 이상의 언어로 다양한 작업을 수행하도록 훈련한 언어 이미지 모델 ‘팔리(PaLI)

www.aitimes.com

 

 

  • 100개 이상의 언어로, 이미지에 대해 설명하거나 Q&A가 가능한 모델 'PaLI'
  • 질의 응답, 이미지 캡션, 객체 감지, 이미지 분류, 광학 문자 인식(OCR), 텍스트 추론 등 작업을 통합 수행

 

얼마 전, 시각 장애인분들께서 쇼핑을 하실 때 겪는 불편함에 대한 기사를 본 적이 있다. 예컨대, 라면은 이미지로 구분하기 쉬운데 시각 장애인분들께서는 대체 텍스트를 읽어주는 음성을 듣게 된다. 문제는 신라면, 열라면, 안성탕면 등으로 적혀 있는 게 아니라 그냥 다 '라면'으로 적혀 있다는 것이다. 이런 문제를 해결할 수 있지 않을까 기대해본다. 그리고 구글의 미친 결과물들에 감탄을 표한다...

 

 

 

AI는 사진 속 풍경도 들여다 봅니다 - AI타임스

광활하게 펼쳐진 사막이나 숲, 또는 눈 덮힌 알프스 산맥 등 멋진 풍경 사진을 보면 한번쯤 그 속으로 뛰어들고 싶은 충동이 느껴진다. \'저 높은 산 위에 오르면 어떤 세상이 펼쳐질까\' \'저 숲

www.aitimes.com

 

  • 구글이 6일(현지시간) 공개한 '3D 뷰 생성 AI'
  • 사진 한 장만 있으면 마치 드론이 사진속으로 들어가 항공 촬영을 하는 것처럼 사진 속 세계를 가상으로 그려준다.

 

할 수 있는 건 다 해보는 것 같다. 데이터 측면에서, 그나마 쌓기 좋은 조건의 기술이라고 생각했다. 하지만 그래도 무진장 어려울 텐데 이 정도 수준의 결과물을 연달아내다니. 구글이 AI에 얼마나 진심이 드러나는 1주였다. 대학생은 그저 웁니다..