블록체인의 장단점
대부분의 블록체인은 분산화된 디지털 원장으로 기능하는 탈중앙화된 데이터베이스로 설계되어 있습니다. 이러한 블록체인 지갑은 블록 안에 데이터를 기록하고 저장하고, 이는 시간 순서대로 구성되며, 암호화된 증명을 통해 연결됩니다. 블록체인 기술의 탄생은 다양한 산업에 많은 이점을 가져다 주었고, 신뢰할 수 없는 상황에 보다 나은 보안을 제공했습니다. 그러나 탈중앙화적 특징에는 단점도 있습니다. 기존의 중앙화된 데이터베이스와 비교할 때, 블록체인은 효율성이 떨어지며, 보다 많은 저장 공간을 필요로 합니다.
블록체인 데이터는 대개 수천 개의 분산화된 네트워크 노드에 저장되기 때문에, 시스템과 데이터는 기술적 실패와 악의적 공격에 대한 강한 저항력을 갖습니다. 각 네트워크 노드는 데이터베이스 사본을 복제하고 저장할 수 있으며, 이 때문에 한 노드가 오프라인으로 전환하더라도 네트워크 이용과 보안에 영향을 미치지 않습니다.
반면, 다수의 전통적인 데이터베이스는 단일 혹은 소수의 서버에 의존하며, 기술적 실패와 사이버 공격에 더욱 취약합니다.
승인된 블록들은 되돌리기가 무척 어려우며, 이는 데이터가 블록체인에 기록된 다음에는 이를 삭제하거나 변경하기가 무척 어려움을 뜻합니다. 재무 기록을 저장하거나 감사 추적을 필요로 하는 데이터에 블록체인은 훌륭한 기술이며, 이는 모든 변경 기록을 추적할 수 있으며 분산화된 공개 원장에 영구적으로 기록되기 때문입니다.
예를 들어, 한 회사는 블록체인 기술을 직원의 부정 행위를 방지하는 데 사용할 수 있습니다. 이러한 상황에서 블록체인은 회사 내에서 발생하는 모든 재정 거래에 대한 보안 더불어 안정적인 기록을 제공할 수 있습니다. 이는 직원으로 하여금 의심스러운 거래들을 숨기기 더욱 어렵게 할 것입니다.
대부분의 전통적인 거래 시스템에서, 거래는 관련 두 당사자가 아닌 은행과 신용 카드 회사 또는 결제 제공자와 같은 중개자에 의존했습니다. 블록체인 기술을 사용하면 중개자가 더 이상 필요하지 않은데, 이는 분산화된 네트워크 노드가 마이닝이라 알려진 과정을 통해 거래를 검증하기 때문입니다. 이러한 이유로 블록체인은 종종 신뢰가 필요없는 시스템(trustless system)으로 지칭됩니다.
그러므로 블록체인 시스템은 단일 조직을 신뢰하는 데서 발생하는 리스크를 제거하고, 중개자와 제3자를 제외함으로써, 전체적인 비용과 거래 수수료를 절감할 수 있습니다.
블록체인 네트워크를 보호하는 작업 증명 합의 알고리즘 트레이딩의 이점 알고리즘(Proof of Work)은 수년에 걸쳐 매우 효율적이라는 것이 증명되었습니다. 그러나 블록체인 네트워크에 대해 수행할 수 있는 몇 가지 잠재적인 공격이 존재하며, 51%의 공격이 가장 많이 논의되고 있습니다. 이러한 공격은 단일 주체가 네트워크 해싱 파워의 50% 이상을 통제할 수 있게 됐을 때 발생할 수 있으며, 고의적으로 트랜잭션 순서를 변경하거나 제외하여 종국에는 네트워크를 방해할 수 있습니다.
이론적으로 가능한 일임에도 불구하고, 51%의 공격이 비트코인 블록체인에 성공했던 적은 한 번도 없었습니다. 네트워크가 더 크게 성장함에 따라 보안이 증대되고, 정직하게 행동하는 것이 더 많은 보상을 얻을 수 있기에, 마이너가 비트코인을 공격하기 위해 많은 돈과 자원을 투자하지 않기 때문입니다. 이외에도, 성공적인 51% 공격은 단기간에 가장 최근의 트랜잭만을 수정할 수 있는데, 이는 블록들이 암호화된 증명을 통해 연결되어 있기 때문입니다(블록의 순서를 변경하는 것은 막대한 연산 능력을 필요로 합니다). 또한 비트코인 블록체인은 매우 탄력적이어서 공격에 빠르게 대처할 수 있습니다.
블록체인 시스템의 또 다른 단점은 블록체인에 데이터가 기록되면 이를 수정하기가 무척 어렵다는 것입니다. 안정성은 블록체인의 장점이긴 하지만, 이것이 언제나 좋은 것은 아닙니다. 블록체인 데이터나 코드를 변경하는 것은 매우 까다로우며, 한 체인이 버려지고 다른 체인이 이를 대신하는 하드 포크를 종종 필요로 합니다.
블록체인은 공개키(혹은 비대칭키) 암호학을 사용해 사용자가 자신의 암호 화폐 자산(혹은 다른 블록체인 알고리즘 트레이딩의 이점 데이터)에 소유권을 주장할 수 있게 합니다. 각 블록체인 계정(혹은 주소)은 상응하는 두 개의 키를 갖고 있는데, 퍼블릭 키(공유될 수 있는)와 프라이빗 키(안전하게 보관되어야 하는)입니다. 사용자는 자신들의 자금에 접근하기 위해 프라이빗 키가 필요하며, 이는 스스로가 자신의 은행 역할을 한다는 것을 의미합니다. 사용자가 만약 프라이빗 키를 잃어버리게 된다면, 사실상 자금을 잃게되며, 이를 어찌할 수 있는 방법이 없습니다.
작업 증명을 사용하는 블록체인은 상당히 비효율적입니다. 마이닝 경쟁이 치열하고, 매 10분마다 단 한 명의 승자만 존재하기 때문에, 다른 모든 마이너들의 작업은 무용지물이 됩니다. 유효한 블록 해시를 찾을 수 있는 확률을 높이기 위해 마이너들은 지속적으로 자신의 연산 능력을 증가시켜 왔기에, 비트코인 네트워크에서 사용되는 자원은 지난 몇 년간 상당히 증가해 왔으며, 현재 덴마크나, 아일랜드, 나이지리아와 같은 국가들보다 더 많은 에너지를 소비하고 있습니다.
블록체인 원장은 시간이 지나며 무척 거대해질 수 있습니다. 비트코인 블록체인은 현재 200GB의 저장 공간을 필요로 합니다. 블록체인 규모의 성장 속도는 하드 드라이브의 성장 속도를 앞지를 것으로 보이며, 원장이 너무 커져 개인이 이를 다운로드하거나 저장할 수 없게 되면, 노드를 잃게 될 위험이 있습니다.
이러한 단점들에도 불구하고, 블록체인 기술은 고유한 장점들을 제공하며, 이는 분명 대중화되고 있습니다. 주류에 채택되기까지는 아직 가야 할 길이 멀지만, 많은 기업들이 블록체인 시스템의 장점과 단점을 이해하기 시작했습니다. 향후 몇 년 간, 블록체인 기술이 어디에서 가장 많은 가치를 더할 수 있는지 알아내기 위해, 기업과 정부가 새로운 애플리케이션들을 실험하는 것을 보게 될 것입니다.
생각이 담아두는 곳
Introduction to Trading, Machine learning&GCP [3] 본문
Introduction to Trading, Machine learning&GCP [3]
Quant Trade 의 장단점에 대해서 알아보았다.
- 시장은 종종, 감정에 의해 움직이고는 하는데 트레이딩 의사결정에 있어 감정을 섞는 것은 좋은 선택이 아니다. 따라서 감정을 배제할 수 있는 것은 퀀트 투자의 장점 중 하나이다.
(여기서 교수님이 egomania 라는 표현을 쓰면서 탐욕을 설명하는데 뭔가 재밌다. 대조적으로 공포를 설명할 때는, self-doubt라는 표현을 사용했다.)
기본적으로 퀀트 알고리즘은 감정보다는 전략을 기반으로 짜여있기 때문에 감정에 휘둘리지 않고 이러한 상황에서 큰 성취도를 보일 수 있다.
- 모호하지 않은 전략
- 위 장점들에도 불구하고 물론 위험할 수 있다. (손실을 낼 수 있다.)
예시로 Knight's Trading Group 이라는 예시를 들었는데
매일 평균 33억 달러를 거래하는 엄청난 투자회사였는데, 자그마한 컴퓨터 실수로 인해 45분동안 70억 달러의 자산 주문을 넣었는데, 아무도 그 수량을 댈만큼 돈이 없었다. (처음 듣는 사례인데 곧 조사해서 글로 써보겠다.)
따라서 강제로 청산해야했고, 이 과정에서 4억 7800만 달러 손실을 보았다.
이 손실 때문에, 억지로 자산투입을 승인해야했고 라이벌회사의 최종적인 승리로 끝났다.
- 퀀트가 시장을 지배하고 있고, 이 때문에 언제나 새로운 경쟁력 있는 경쟁자들이 등장할 수 있다.
- 퀀트 전략은 그 퀀트 투자자의 가정사실 기반에서만 최적화되었을뿐이지, 실제로는 모른다.
- 이익은 절대 확정적일 수 없다.
- 확정적 이익을 취하려면(no risk) 국채를 사면 된다. 대부분 음수의 수익률이지만.
- 실제 세상은 급변하고 바뀌기 때문에(정권 상관관계, 변동성 등등), 그에 맞게 전략 또한 실시간으로 수정되어야 한다.
Exchange Arbitrage & Statistical Arbitrage
Arbitrage 는 보통 차익거래를 뜻하는데, 내가 공부할 때 본건 무위험 차익거래 같을 때 쓰는 용어로 봤다.
1. Exchange Arbt
출처 제목 참조, coursera 강의
exchange라고 하여서 스왑이나 환쪽을 생각했는데 생각보다 단순한 것이었다.
위 예시로는 단순하게 뉴욕거래소에서 100달러 10센트에 주식을 팔고 같은 주식을 나스닥에 100달러에 매입한다.
이것이 유지된다고 하면, 당연히 한 주식 당 10센트의 무위험 차익거래를 완성시킬 수 있다. 물론 현실에는 없고 있다 하더라도 수초내에 사라지기 마련이다.
이러한 무위험 차익거래의 기회는 네트워크간 송신 속도가 빨라짐에 따라 점점 희박해진다.
(서로 간 통신이 빨라지면 가격 사이의 차이가 날 확률도 당연히 줄어듬)
또한 low-latency(저지연) 전략 또는 매우 빠른 실행 전략을 쓰는 high-frequency 회사가 늘어날수록 이러한 기회는 줄어든다.
2. Carry Arbt
출처 제목 참조, coursera 강의
처음에는 이해가 잘 안되었다. 내가 이해한 바는 아래와 같다.
1. 현물시장에서 골드를 1550달러에 산다. (이건 골드를 실제로 매입하는 것. 진짜 금)
2. 1년 뒤, 1580원에 골드를 팔 수 있는 선물을 매도함, 즉 1년 뒤, 1580달러를 받고 골드를 인도 해줘야 함.
3. 즉 1580 - 1550 = 30달러만큼 차익을 거둠
강의에서는 골드 보관 비용으로 10 basis point라 하였으므로(0.1%) 이를 제외하면 나머지는 무위험 차익거래, 즉 arbitage임
위 경우는 아마도 선물가격이 고평가된 상태에서 이뤄지는 매수차익거래를 뜻한 것 같음.
그리고 본문에서는 leased gold out이라고 되어 있는 걸 보관비용이라고 해석했는데 틀린 것 같기도함.
가장 보편적인 위험 아비트리지 전략 중 하나.
출처 제목 참조, coursera 강의
보통의 주식들이(미국 주식) 영업이익 증가등으로 인해 우상향 그래프를 그리는데 그런 기업들말고
mature 한 기업들 중 특정 boundary내에서 왔다갔다 하면 위에서 팔고 아래서 사면 되는 단순한 전략
출처 investing.com
보다시피 우리나라 코스피 지수도 최근 몇 개년동안은 박스피라 불리면 박스권에 갇혀있었다. 이럴 때 쓰는 전략.
다만 여기서 질문하는 것이, 95에 사고 105에 파는 저 단순한 전략이 만약 좀 더 큰 변동성을 만났을 때이다.
만약 110까지 올라가거나 90으로 떨어진다면?
110까지 올라가는 경우는 어차피 익절이라 보면 되니 심리적 타격은 적고
90으로 떨어지는 경우, 당신은 90에서 손절을 할 것인가 또는 그냥 홀딩할 것인가는 꽤나 도전을 요하는 문제이다.
만약 이런 상황에 부딪히기 싫어, 바운더리를 넓게 잡는다면(80에 매수, 120에 매도)
당연히 돈을 잃을 확률은 엄청 떨어지겠지만, 애초에 매매를 할 수 있는 확률이 줄어든다.
따라서 이 바운더리를 잡는 것이 중요하다.
4. Pairs Trading (Statistical Arb)
출처 제목 참조, coursera 강의
공분산, 역사적 지표등등 여러가지를 활용해 어떤 주식 두 개가 상관관계에 있을 때, 헷징용도이든 수익목적이든
무위험 차익거래를 실현해볼 수 있다.
A라는 주식이 B라는 주식보다 평균 회복 시간이 더 짧을 것이라 생각해 0시점에서 A를 매수, B를 매도 했다고 가정해보자.(공매도)
시간이 조금 흐르고 바로 거래를 청산하면 A가 110인 시점에서 B는 가격을 유지하고 있으므로 10만큼 이득
다시금 둘이 가격이 같아졌을 때, 같은 전략 사용 , A와 B는 조건에서 같은 거래소에서 거래되는 같은 섹터에 있는 주식이므로, 장기간 관점에서 같이 움직이고 시장위험에 covered되어 있다고 볼 수 있다.
다만 이 전략은 무척이나 위험할 수 있다. 예시에서만 봐도 시작 시점을 잘못 잡으면, 손해가 엄청 커진다.
과거 주가 흐름에서 시점의 길이를 얼마나 잡느냐에 따라 둘의 상관관계는 크게 달라질 수 있다.
단순히 두 주식간의 상관관계는 불안정하기로 악명높다.
주식뿐만이 아니라, 채권, 옵션, 선물, 선도 등등 다양한 상품과 pair trading 을 해볼 수 있다.
채권과의 pair trade 혹은 서로 관계가 밀접한 상품간의 pair trade의 경우, 훨씬 안정적인 상관관계를 보인다.
5. Index Arb
ETF 는 현재 5조 달러의 자산을 추종하고 있다고 한다.
High-frequency stragey 중 하나이다.
가령 KODEX 200 이라는 etf을 타겟으로 하면, 그 etf 를 구성하는 종목들을 주식으로 전부 비율에 맞게 매수하고, etf 가격과 비교하여 괴리가 있으면 이를 이용하는 것이다. (한 쪽이 비싸면, 그것을 팔고 싼 것을 사는 방향으로)
당연히 이를 위해서는,
실시간 대용량 데이터를 틱 단위로 받아와야하고
높은 성능의 컴퓨터와
서버와의 딜레이가 가장 적은 곳에서 트레이딩이 진행되어야 한다.
Stat Arb을 하기 앞서 알아보는 넘어야 할 벽들.
이미 많은 기업들이 훌륭한 기반시설로 이 전략을 사용 중이라 들어갈 틈이 없어 보이지만,
보다 유동성이 떨어지지만 작은 시장들이 많아 거래량을 낮추고 이런 곳에 접근하면 된다.
- 거래하고, 청산하고, 교환하는데 드는 비용( ex, 수수료)
- 리스크가 부담되는 거래(공매도 같은 것을 했을 때, 담보 부담)
- 공매도할 때, 주식을 빌리는 비용. 인기가 많을수록 그 비용이 비쌈. (예시로 비욘드 미트라는 기업을 들었는데, 빌리는데 그 비용이 60%라고 한다 ㄷㄷ.. 100달러는 담보로 내고 빌리고, 기간이 끝난 뒤, 40달러만 받음)
- 시장가에 매수매도를 하니, 그 스프레드 차에서 오는 비용을 감당해야한다. (high-frequency 가 아니므로) 이 비용을 유동성을 위한 비용이라 한다.
- 지속적으로 실시간 데이터를 구입하는데 드는 비용, 단순하게 고가 저가 시가 등등은 무료인 데이터이지만, high-frequency 를 가능하게 하는 데이터들은 비용이 든다. 실시간 거래에 활용되는 틱 데이터 같은 경우는 비싸다.
- 유동성이 큰, 유명한 시장 같은 경우는 차익거래기회가 당연히 적다.
- 유동성을 다소 포기하고 작은 시장에서 거래하는 경우, 매수매도 호가 스프레드와 거래하는 규모를 생각해서 진입해야한다.
-> 큰 bid-ask spread 와 낮은 유동성, 낮은 trade- frequency 가 특징. 거래가 많이 안 일어나므로, 아비트리지 행사가 어려움. market maker들이 적거나 경쟁할 이유가 없어 bid-ask spread 가 큼.
- 특정 주식 또는 특정 시장들은 주식을 빌리기 힘들 수 있다. 인기가 많거나 아니면 단순하게 시장이 열리지 않거나.
- timeframe 문제. 이전에 Pair trade를 예시로 들면, 이 기간이 길수록, 외부영향이 상관관계에 영향을 미칠 가능성이 커지고, 반대로 작게 하면 이러한 위험들은 줄어들고 이익을 알고리즘 트레이딩의 이점 얻을 확률이 높아지지만 많은 거래 비용을 요한다.
- 마지막으로, 상관관계나 시장을 바꿔야 하는 것.
스프레드나 correlation 을 거래할 때, 우리는 거래하는 시장 또한 바꿔야 한다.
내 거래로 인해, 가격과 유동성 측면에서 변화가 생긴다.
스프레드가 한 방향으로 너무 강하게 움직이면, 다른 시장 참여자들이 거래를 포기할 수 있다. (ex, 바이 사이드에서 매수 잔량이 매도 잔량보다 압도적으로 많은 경우)
경쟁자들이 주문 패턴을 알아차리고 똑같이 거래할 수 있다.
너무 많이 거래하거나 너무 오래 거래하면, 차익거래를 만들어내는 상관관계가 죽을 수 있다. 특히 경쟁자가 같은 전략을 취할 때.
암호화폐 자동매매프로그램 'TurtleBot'(터틀봇) "타 프로그램 비교 강점 많다"
암호화폐가 급부상 하면서 자동 프로그램을 통해 암호화폐를 거래하는 System인 'TurtleBot'이 4년 전부터 개발이 시작되어 최근 출시되었다.
앞으로 코인시장의 규모가 많이 커질 것으로 예상된다. 그렇게 되면 지금의 주식시장처럼 암호화폐 매매를 하려는 사람들이 늘어나게 될 것이다. 하지만 일반인이 트레이딩을 배운다는 것이 쉽지 않기 때문에 자동매매프로그램을 통해 수익을 창출할 수 있는 기회를 ‘TurtleBot'이 제공한다.
‘TurtleBot'이 시장 확장을 위해 추진하고 있는 자동매매프로그램은 다양하며, 타 프로그램과 비교하여 많은 강점을 가지고 있다. 기존 거래소에서 제공하고 있는 오토트레이딩이라는 서비스는 마틴게일로 AI라는 단어를 무색하게 만드는 단순한 메크로시스템일 뿐이지만, ‘TurtleBot'은 추세매매 방법의 알고리즘과 계발자의 여러 트레이딩 방식을 로직화 하여 프로그램화 했다. 현재까지 진행상황은 빗썸의 자동매매프로그램을 만들었으며, 향후 업비트, 바이낸스, 후오비까지 추진할 예정이다.
‘TurtleBot'은 현재 모 대학교와 빅데이터를 통한 인공지능(AI)이 가능토록 논의 중에 있으며, 산학협력을 통해 더 안전하게 수익을 창출할 수 있는 토대를 구축하기 위해 노력하고 있다.
‘TurtleBot'의 가장 이점이라 할 수 있는 특징은 추새를 인지하는 알고리즘으로 인해 안정적인 수익을 창출할 수 있는 가능성을 보다 효율적으로 상승시키는데 있다. 원리는 간단하지만 사람이 가지고 있는 감정적인 부분이 실제 트레이딩시에 미치는 영향을 줄이고 시낭에 대한 변수를 최소화 할 수 있는 이점이 있기 때문에 타 어떤 오토트레이딩 봇들보다 강한 차별성과 특징을 지니고 있다.
반대로 급락하는 시장에서의 손실을 최소화 할 수 있는 추세인식으로 타 트레이딩 봇처럼 분할매수를 하면서 저점을 내리는 행위는 하지 않는다. 하락을 예상하고 거래량이나 모든 불안요소를 감지하여 최소한에 손실을 보고 매도하면서 빠져 나온 뒤 다시 상승에 추세가 올 때까지 절대 추가적인 매수를 하지 않는다.
세계에서 최초로 개발된 추세매매 ‘TurtleBot'의 공급사인 주식회사 본퍼스트의 한민우 대표이사는 “암호화폐가 투기가 아닌 투자와 매매를 할 수 있게 환경을 조성하는 것이 중요하다”며, “앞으로 암호화폐 시장의 규모가 확대되면서 일반인도 많이 유입이 될 것으로 판단된다. 그리고 요즘처럼 비대면과 일자리가 없는 상황에서 ‘TurtleBot'을 통해 4차 산업시대에 맞는 새로운 수익모델을 만들고, 일자리 창출에도 기여할 수 있다고 생각된다”고 밝혔다.
이어 “암호화폐 시장은 국가를 초월하는 시장이기에 우리나라 IT 기술이 세계에 알려지고 확대될 수 있는 좋은 기회”라며, “이를 바탕으로 글로벌 시장 개척은 물론 코인 거래가 제도권 밖에 있을 경우 일반 거래자가 피해를 당할 수 있지만, 앞으로는 제도권화 되어가고 있는 추세에 따라 안전한 거래는 물론 거래 활성화에도 기여할 것으로 기대된다”고 전했다.
금융분야의 머신러닝
전략 교수님은 한 분야에 모든 노력과 자원을 집중해서는 안 된다고 말씀하시곤 하셨습니다. 그 부위가 약해지면 모든 것을 잃는 경향이 있다. 그녀는 사업적인 관점에서 이것에 대해 이야기하곤 했었고, 따라서 매우 이른 시기에 저에게 '잃어버린 벽돌을 쌓는 방법'과 '우리의 층'을 가르쳐주었습니다.
경제학 교수님은 나에게 돈을 현명하게 쓰라고 가르쳐주셨고, 인플레이션도 가르쳐주셨다. 결론: 항상 대체 소득, 다른 출처 또는 추가 수입(돈에 대한 플랜 B)이 있어야 합니다.
우리 재무 교수님이 말씀하시곤 하셨는데, 한 바구니에 모든 계란을 넣지 말라고 하셨어. 리스크를 분산시키고 최대한의 이점을 얻을 수 있도록 개인 금융 또는 비즈니스 결정을 내리십시오.
여기에 언급된 모든 것이 중요하고 적용되어야 하지만, 금세기에는 기술의 도움 없이 그것을 할 수 있을까? 너는 그 답을 알 만큼 똑똑해야 한다. 운영 비용이 절감되고(프로세스 자동화 덕분에), 매출이 증가하고 생산성이 향상됨에 따라 소비자 환경이 개선됩니다. 규정 준수 및 보안 강화에 대해 어떻게 언급하지 않을 수 있습니까? 지금 제가 할 수 있는 일은 기계 학습 감사뿐입니다.
금융 시스템에 머신 러닝이 등장함에 따라, 명시적 프로그래밍 없이도 엄청난 양의 데이터를 저장, 분석, 계산 및 해석할 수 있다.
구글은 응답자 1,600여 명을 대상으로 조사한 알고리즘 트레이딩의 이점 결과 회사 규모에 관계없이 61%가 ML과 AI를 내년 회사의 가장 중요한 데이터 이니셔티브로 지목했다고 밝혔다. (2018년 2월 7일)
금융에서 머신 러닝을 활용하는 방법
비현실적인 추정과 예산 고갈로 적절한 소프트웨어 인프라를 갖추는 것만으로는 충분하지 않습니다. 가치 있는 머신 러닝 개발 프로젝트를 제공하기 위해서는 명확한 비전, 기술 지식 및 집중력이 필요합니다.
이 기술을 잘 이해하는 즉시 비즈니스 목표를 달성하고 아이디어 검증을 진행하는 데 도움이 될 것입니다. 이것은 데이터 과학자들을 위한 작업이다. 이들은 아이디어를 조사하여 실행 가능한 KPI를 공식화하고 현실적인 추정치를 산출할 수 있도록 지원합니다.
참고: 이 시점에서 모든 데이터를 수집해야 합니다. 그렇지 않으면 이 데이터를 수집하고 정리할 데이터 엔지니어가 필요합니다.
특정 사용 사례와 비즈니스 조건에 따라 금융 회사는 머신 러닝을 채택하기 위해 다른 경로를 따를 수 있습니다. 실용화하자!
금융의 머신러닝 응용 프로그램
트랜잭션 수, 사용자 수, 타사 통합 및 머신 러닝 알고리즘은 부정행위를 탐지하는 데 탁월합니다.
은행은 이 기술을 사용하여 수천 건의 트랜잭션을 모니터링할 알고리즘 트레이딩의 이점 수 있습니다. 이러한 모델은 높은 정밀도로 사기 행위를 탐지하고 의심스러운 계정 동작을 식별합니다.
머신 러닝 알고리듬은 트랜잭션을 평가하기 위해 분할 초가 필요하다. 그 속도는 범죄가 이미 저질러진 후에 그것들을 발견하는 것만이 아니라, 실시간으로 사기들을 예방하는 데 도움이 된다.
2. 재무 모니터링
데이터 과학자들은 많은 소액결제와 깃발을 감지하기 위해 알고리즘 트레이딩의 이점 시스템을 훈련시킨다. 스머핑과 같은 돈세탁 기술은 재정 감리에 의해 예방될 수 있는 그러한 사례 중 하나이다. 머신 러닝 알고리듬은 네트워크 보안을 크게 향상할 수 있다. 이러한 기술이 가까운 미래에 가장 진보된 사이버 보안 네트워크에 힘을 실어줄 가능성이 크다.
아디엔, 페이오네어, 페이팔, 스트라이프, 스킬과 같은 회사들은 주목할 만한 핀테크 기업들이다. 이 회사들은 보안 머신 러닝에 많은 투자를 한다.
3. 부정행위 탐지 및 예방
당신은 'Freedom 251'을 기억하나요? 이 스마트폰은 Ringing Bells Private Limited가 인도에서 251파운드의 판촉 가격으로 판매한 스마트폰이었다. 세계에서 가장 저렴한 스마트폰으로 마케팅을 했지만, 나중에는 약속했던 것과는 정반대인 것으로 밝혀졌다.
그 회사는 2016년 6월에 5백만 대의 전화기를 팔기로 계획했다. 주요 예약 때문에 웹사이트가 다운되었다. Rs 251 가격으로 30,000건의 예약이 필요했습니다. 더 말할 필요도 없이, 그것은 그 회사가 하려고 했던 사기 계획이었다.
나는 미래에 그러한 사기를 행하는 것이 가능하지 않다고 말하는 것이 아니다. 그러나 머신 러닝(machine learning)과 금융 사기와 관련된 부정행위 탐지 소프트웨어 전쟁을 억제할 수 있습니다. 이러한 부정 트랜잭션을 식별하고 방지하기 위해서는 대량의 데이터를 분석하는 데 도움이 될 수 있는 정교한 설루션이 필요합니다. 머신러닝으로 새로운 희망이 생겼다. 패턴을 발견할 수 있으며 예측 분석을 사용하고 기계 학습 알고리즘을 적용하여 이러한 부정 트랜잭션을 차단할 수 있다.
4. 투자 예측
머신 러닝은 고급 시장 통찰력을 제공합니다. 펀드매니저는 머신러닝(machine learning)을 이용해 기존 투자 모델을 통해 시장 변화를 가능한 일찍 파악한다.
머지않아 머신러닝 기술이 투자은행 산업을 교란시킬 것이다. JP모건, 뱅크 오브 아메리카, 모건스탠리와 같은 주요 기관들은 자동화된 투자자문을 개발했다. 이것들은 기계 학습 기술에 의해 작동됩니다. 그러나 투자 예측을 통해 리스크를 최소화할 수 있다고 생각한다면, 그런 일은 결코 일어나지 않습니다. 누군가가 누군가의 손실이 누군가의 이득이라고 말한 것은 옳다.
5. 리스크 관리
리먼 브라더스 홀딩스는 세계적인 금융 서비스 회사였다. 이 은행은 골드만 삭스, 모건 스탠리, 메릴 린치에 이어 미국에서 네 번째로 큰 투자 은행이었다. 그것의 알고리즘 트레이딩의 이점 운영은 투자 은행, 주식 및 고정 수입 판매와 무역 조사, 투자 관리, 사모, 그리고 개인 은행 분야에서 이루어졌다. 하지만, 슬픈 부분은 그것의 운영이 2008년에 닫혔다는 것이다.
글로벌 시장이 타격을 받고 다른 은행들도 위태로운 처지에 놓였기 때문이다. 그들은 모기지 시장에 크게 관여하게 되었고 서브프라임 모기지 판매자 BNC 모기지에게 알고리즘 트레이딩의 이점 빚을 졌다. 그 투자자는 은행에 대한 신뢰를 잃었다. 따라서 리스크 관리의 부재가 서브프라임 모기지 사태로 이어졌다.
기존 소프트웨어 애플리케이션은 대출 애플리케이션 및 재무 보고서의 정적 정보를 기반으로 신용도를 예측했습니다. 그러나 머신러닝 기술로 그 영역이 더욱 넓어졌습니다. 이제 현재 시장 동향과 관련 뉴스 항목까지 빠르게 파악할 수 있다.
이를 통해 리스크 관리가 확대되고 금융범죄 예방과 금융위기 예측에 도움이 될 수 있다.
6. 로보 어드바이저
로보 어드바이저는 이제 금융 분야에서 보편화되었다. 자문 영역에는 기계 학습의 두 가지 주요 응용 프로그램이 있다. 다음과 같습니다.
- 포트폴리오 관리 - 알고리즘과 통계를 사용하여 고객의 자산을 할당, 관리 및 최적화하는 온라인 자산 관리 서비스입니다. 여기에 사용자는 현재 금융자산과 목표를 입력합니다. 예를 들어 X 씨가 50세까지 백만 달러를 저축한다면 로보 어드바이저(Robo-advisor)는 자신의 위험 선호도와 원하는 목표에 따라 투자 기회 전반에 걸쳐 현재 자산을 할당하게 됩니다.
- 금융 상품 추천 - 많은 온라인 보험 서비스들이 로보 어드바이저를 사용하여 개인화된 보험 플랜을 추천하기 때문에 고민자 님은 딜레마에 직면하지 않습니다. 그래서 고객들은 개인 금융 고문보다는 로보 어드바이저로 혼란을 해결한다. 로보 어드바이저는 수수료 인하를 지원할 수 있을 뿐만 아니라 개인 맞춤 및 보정된 권장 사항을 제공합니다.
7. 고객 서비스
금융기관들의 문제는 그들이 목표를 달성하고 따라서 고객을 잘못된 방향으로 이끌려고 노력한다는 것이다. 수익을 극대화하기 위해 고객을 이용하려고 시도하는 경우도 있습니다. 따라서 가상 보조자의 도움을 받으면 편견이 줄어들 수 있습니다. 유일한 실상은 유망한 투자자들에게 보일 것이고 그들은 정확한 정보와 그들의 문제에 대한 빠른 해결책을 얻을 수 있을 것이다.
예전에도 챗봇이 존재했지만 효과는 그리 크지 않았다. 이제, 기계 학습으로, 그들은 배울 수 있습니다. 각 고객의 행동에 따라 접근 방식을 조정합니다. 단순히 정해진 일련의 지시사항을 따르는 것이 아니라, 사용자가 일반 사람처럼 질문을 하는 것을 도울 수 있다.
8. 대출 서류 작성
머신 러닝은 위험을 식별하고 높은 보험료를 설정하는 데 도움이 됩니다. 역사적 패턴과 현재 트렌드로 보험사들이 수익성을 높이기에 안성맞춤인 차량이다. 머신 러닝은 언더 쓰기의 위험을 줄여줍니다.
이러한 위험은 자금 보호와 관련된 모든 분야에서 처리될 수 있다. 대출, 건강, 주택담보대출, 생명보험 중 어느 것이든 머신러닝은 모든 위험을 관리하는 데 도움이 될 수 있다.
그것은 또한 금융과 보험에서 매우 흔한 업무와 완벽하게 들어맞는다. 데이터 과학자는 각 고객에 대해 수백 개의 데이터 항목이 포함된 수천 개의 고객 프로파일에 대한 모델을 교육하고 실제 환경에서 언더 쓰기 및 신용 점수 매기기 작업을 수행합니다. 이러한 채점 엔진은 직원들이 훨씬 더 빠르고 정확하게 작업할 수 있도록 도와줍니다.
지금까지 재무 관련 머신 러닝 기사에 혼선이 있었습니까? 의견란에 당신의 의문을 공유하세요.
9. 무역 결제
무역결제란 대금을 교환하고 결제하는 과정을 말한다. 많은 이슈들이 무역 결제에 지장을 초래할 수 있다. 그러나 기계 학습은 이러한 경우가 아니며 거래 실패가 없다는 것을 보장합니다.
현대적 거래 플랫폼과 함께 규제 요건은 줄어들었다. 이것은 무역 실패를 줄였다. 비효율성의 제어는 수동으로 해결되었습니다. 이제 머신 러닝을 통해 실패의 원인을 알 수 있을 뿐만 아니라 그에 대한 해결책도 제공할 수 있습니다. 그것도 몇 초 안에. 또한, ML은 정상적인 거래 패턴에 대한 예외를 식별함으로써 어떤 거래가 실패할 가능성이 있는지를 예측할 수 있다.
10. 마케팅
마케팅은 기업 금융과 은행업계에 종사하는 사람들을 돕는다. 예측 분석을 마케팅에 도입함으로써 과거의 행동을 바탕으로 예측을 할 수 있는 능력이 쉬워졌습니다.
웹 활동을 적절하게 모니터 할 수 있고, 모바일 앱 사용을 이해하여 트렌드와 패턴을 찾을 수 있습니다. 또한, 이전의 광고 캠페인에 대한 반응도 분석할 수 있습니다. 머신 러닝 소프트웨어를 사용하면 정확한 예측이 이루어지고 마케팅 전략의 효과가 향상됩니다.
11. 네트워크 보안
컴퓨터 바이러스, 웜, 트로이 목마, 좀비 및 보넷은 오랫동안 존재하는 바이러스입니다. 가장 큰 과제는 현대의 정교한 사이버 공격을 식별하는 것이었는데, 이는 그것이 과거의 보안 소프트웨어로 밀려날 수 없기 때문이다.
첨단 기술을 통해 머신러닝 보안 설루션은 세계 금융 데이터를 안전하게 보호할 수 있습니다. 빅 데이터 기능과 결합된 지능형 패턴 알고리즘 트레이딩의 이점 분석 기능은 ML 보안 기술을 통해 기존의 비 AI 툴보다 앞서 있습니다.
12. 알고리즘 트레이딩
시간, 가격, 물량 등의 변수를 설명하는 지시사항이 시간이 지남에 따라 주문의 작은 조각을 시장에 내보내는 자동화된 사전 프로그램 거래입니다. 거래 프로세스의 자동화로 사전 정의된 기준이 설정됩니다. 이 작업은 거래자나 펀드매니저가 수행합니다.
알고리즘 트레이딩을 위한 머신 러닝은 지능형 트레이딩에 가깝습니다. 자동보다 알고리즘 트레이드를 더 많이 만들 수 있는 새롭고 다양한 도구 모음을 제공합니다.
그들은 무역 예측을 하고 특히 역사적인 시장 행동을 분석하고 최적의 시장 전략을 결정하기 위해 큐레이션 된다.
13. 프로세스 자동화
프로세스 자동화로 문서의 해석이 효과적이 되었습니다. 또한 데이터 분석을 효과적으로 실행할 수 있습니다. 지능형 응답을 실행하여 문제가 발생하기 전에 사람의 주의가 필요한 문제를 식별할 수 있습니다.
또한 머신 러닝은 기관의 프로세스에 대한 실시간 감사를 실시하여 규제 준수를 만든다.
우리는 자동화가 수동 작업을 대체하고 반복적인 작업을 자동화한다는 것을 알고 있다. 그러나, 생산성 향상과 함께, 머신 러닝은 기업이 비용을 최적화하고, 고객 경험을 개선하고, 서비스를 확장할 수 있도록 지원합니다.
- 챗봇
- 콜 센터 자동화.
- 서류 자동화.
- 직원 교육 등을 게임화합니다.
이것의 예는 JP모건 체이스이다.
JP Morgan Chase는 Natural Language Processing을 활용할 수 있도록 지원합니다. 그것은 기계 학습 기술 중 하나이다. 콜 센터에서는 법률 문서를 처리하고 해당 문서에서 중요한 데이터를 추출합니다. 연간 12,000건의 상업 신용 계약을 수동으로 검토하는 데는 일반적으로 약 360,000시간의 노동 시간이 소요됩니다. 그러나 머신 러닝 리뷰를 사용하면 몇 시간 만에 동일한 내용을 검토할 수 있습니다.
14. 콘텐츠 작성
콘텐츠 작성자, 아티스트, 그리고 다른 콘텐츠 제작자들이 머리를 짜내야만 하는 시대는 지났다(창의적인 사람들:P). 자연어 처리(NLP)와 기계 학습의 발달로 기계는 콘텐츠를 생성할 수 있다.
금융기관이 작성한 내용은 반복적이다. 새로운 콘텐츠를 만들거나 새로운 콘텐츠에 추가할 필요가 거의 없습니다. 재무 요약(대차대조표 및 P/L) 회사 프로필, 심지어 주식 보고서도 ML 소프트웨어로 쉽게 작성할 수 있습니다. 시간은 돈이고, 기계학습은 인간보다 그것을 더 잘 안다.
15. 돈세탁 방지
기계 학습은 돈세탁 활동을 차단합니다. 돈세탁 특유의 패턴을 파악할 수 있다. 따라서 탐지율이 증가하고 잘못된 긍정 평가가 감소하며 규제 컴플라이언스가 쉬워집니다.
16. 사용자 지정 머신 러닝 설루션
금융 기관이 머신 러닝 설루션에 보다 수용적이 되면서 ML 기술을 어디서 취득해야 하는가에 대한 문제가 대두되고 있다.
이로써 금융 분야의 머신 러닝에 대한 튜토리얼이 끝났습니다. 우리는 사례와 함께 금융 분야에서 머신 러닝의 다양한 활용 사례를 연구했다. 이번에는 기업가들을 위한 기계 학습에 대한 기사를 위한 차례입니다.
알고리즘 트레이딩의 이점
머신러닝은 인간에게는 자연스러운 능력인 경험으로부터의 학습을 컴퓨터에게 가르칩니다. 머신러닝 알고리즘은 모델로 미리 알고리즘 트레이딩의 이점 지정한 방정식을 사용하지 않고 여러 계산 기법을 사용해 데이터로부터 직접 정보를 “학습”합니다. 학습에 사용 가능한 표본의 개수가 늘어나면 알고리즘의 성능도 그에 맞춰 개선됩니다.
머신러닝에는 두 가지 유형의 기법이 사용됩니다. 하나는 알려진 입출력 데이터에 대해 모델을 훈련시켜 모델이 미래의 출력값을 예측할 수 있도록 하는 지도 학습(supervised 알고리즘 트레이딩의 이점 learning)이고, 다른 하나는 입력 데이터에서 은닉 패턴이나 내재(고유) 구조를 찾아내는 비지도 학습(unsupervised learning)입니다.
머신러닝 지도 학습의 목적은 불확실성이 존재하는 상태에서 증거를 기반으로 예측하는 모델을 만드는 것입니다. 지도 학습 알고리즘은 알려진 입력 데이터 세트와 이 데이터에 대해 알려진 응답 변수(출력값)를 받아들인 후, 새 데이터에 대한 응답 변수에 대해 타당한 예측값을 생성하도록 모델을 훈련시킵니다. 지도 학습은 분류 기법과 회귀 기법을 사용하여 예측 모델을 도출합니다.
분류(classification) 기법은 이메일의 스팸 여부나 종양의 악성 여부와 같은 범주형 응답 변수를 예측합니다. 분류 모델은 입력 데이터를 범주로 분류합니다. 일반적인 응용 사례로는 의료 영상 처리, 이미지 및 음성 인식, 신용 평점 등이 있습니다.
회귀(regression) 기법은 온도 변화나 전력 수요 변동과 같은 연속형 응답 변수를 예측합니다. 일반적인 응용 사례로는 전기 부하 전망, 알고리즘 트레이딩 등이 있습니다.
비지도 학습은 데이터에서 은닉 패턴이나 내재 구조를 찾아냅니다. 비지도 학습은 레이블이 지정된 응답 변수가 없는(출력이 정의되어 있지 않은) 입력 데이터로 구성된 데이터셋에서 추론을 하는 데 사용됩니다. 군집(clustering)은 가장 일반적인 비지도 학습 기법입니다. 군집은 탐색적 데이터 분석을 통해 데이터에서 은닉 패턴이나 그룹 구조를 찾아냅니다. 군집의 응용 사례로는 유전자 염기서열 분석, 시장 조사, 사물 인식 등이 있습니다.
최적의 알고리즘 선택하기
저마다 서로 다른 방식으로 학습하는 수십 개의 머신러닝 지도 및 비지도 학습 알고리즘 중에서 최적의 알고리즘을 선택하기란 쉽지 않아 보일 수 있습니다. 가장 좋은 방법이나 모든 사례에 두루 적용되는 방법은 없습니다. 최적의 알고리즘을 찾으려면 때로는 시행착오를 거쳐야 합니다. 숙련된 데이터 과학자라도 먼저 시행착오를 겪지 않고서는 알고리즘이 제대로 작동할지 여부를 알 수 없습니다. 유연성이 높은 모델은 잡음일 가능성이 있는 미미한 변화를 모델링함으로써 데이터를 과적합할 수 있습니다. 단순한 모델은 비교적 해석하기가 쉬운 반면 정확도가 떨어질 수 있습니다. 따라서 최적의 알고리즘을 선택하려면 모델 속도, 정확도, 복잡성과 같은 이점들을 절충해야 합니다. 머신러닝의 중심에는 시행착오가 존재합니다. 하나의 방식이나 알고리즘이 제대로 작동하지 않는다면 다른 방식이나 알고리즘을 시도해 봐야 합니다. MATLAB ® 에는 여러 머신러닝 모델을 사용해 보고 그중에서 가장 적합한 모델을 선택할 수 있도록 지원하는 다양한 툴이 있습니다.
머신러닝 작업을 해결하는 데 도움이 되는 MATLAB 앱과 함수를 살펴보려면 다음 표를 참조하십시오. 머신러닝 작업에는 앱을 사용하는 것이 도움이 되는 것도 있고, 명령줄 기능을 사용하는 것이 효과적인 것도 있습니다.
분류 학습기 앱을 사용하여 몇몇 선별된 모델을 자동으로 훈련시키고 가장 적합한 모델을 선택할 수 있습니다. MATLAB 코드를 생성하여 스크립트를 사용할 수 있습니다.
더 많은 옵션이 필요하면 명령줄 인터페이스를 사용할 수 있습니다.
회귀 학습기 앱을 사용하여 몇몇 선별된 모델을 자동으로 훈련시키고 가장 적합한 모델을 선택할 수 있습니다. MATLAB 코드를 생성하여 스크립트 및 기타 함수 옵션을 사용할 수 있습니다.
더 많은 옵션이 필요하면 명령줄 인터페이스를 사용할 수 있습니다.
다음과 같은 체계적인 머신러닝 워크플로는 머신러닝 문제를 해결하는 데 도움이 될 수 있습니다. MATLAB에서 전체 워크플로를 완료할 수 있습니다.
가장 적합하게 훈련된 모델을 생산 시스템에 통합하려면 MATLAB Compiler™ 를 사용하여 Statistics and Machine Learning Toolbox 머신러닝 모델을 배포할 수 있습니다. 여러 모델에서, MATLAB Coder™ 를 사용하여 예측을 위한 C 코드를 생성할 수 있습니다.
분류 학습기 앱에서 분류 모델을 훈련시키기
머신러닝 지도 학습을 사용하여 데이터를 분류하려면 분류 학습기 앱을 사용하여 모델을 훈련시킵니다. 이 앱을 사용하면 다양한 분류기를 사용하여 머신러닝 지도 학습을 대화형 방식으로 탐색할 수 있습니다.
몇몇 선별된 모델을 자동으로 훈련시켜 가장 적합한 모델을 선택하도록 도움을 줍니다. 모델 유형에는 결정 트리, 판별분석, 서포트 벡터 머신, 로지스틱 회귀, 최근접이웃, 나이브 베이즈, 커널 근사, 앙상블 분류, 신경망 분류기 등이 있습니다.
데이터를 탐색하고, 검증 방식을 지정하고, 특징을 선택하고, 결과를 시각화합니다. 기본적으로, 이 앱은 교차 검증을 적용하여 과적합을 방지합니다. 또는 홀드아웃 검증을 선택할 수도 있습니다. 검증 결과를 바탕으로 데이터에 가장 적합한 모델을 선택합니다. 검증된 모델의 결과는 플롯이나 성능 측정값을 통해 확인할 수 있습니다.
모델을 작업 공간으로 내보내어 새 데이터로 예측을 수행합니다. 항상 이 앱은 지정된 검증 방식이 적용된 모델을 따르고, 또한 모델을 전체 데이터에 대해서도 훈련시키고, 모델을 내보낼 때는 전체 모델을 내보냅니다.
앱에서 MATLAB 코드를 생성하여 스크립트를 만들거나 새 데이터로 훈련시키거나 규모가 큰 데이터 세트를 사용하거나 추가 분석을 위해 코드를 수정합니다.
더 많은 옵션이 필요하면 명령줄 인터페이스를 사용할 수 있습니다. 분류 항목을 참조하십시오.
회귀 학습기 앱에서 회귀 모델 훈련시키기
머신러닝 지도 학습을 사용하여 연속 데이터를 예측하려면 회귀 학습기 앱을 사용하여 모델을 훈련시킵니다. 이 앱을 사용하면 다양한 회귀 모델을 사용하여 머신러닝 지도 학습을 대화형 방식으로 탐색할 수 있습니다.
몇몇 선별된 모델을 자동으로 훈련시켜 가장 적합한 모델을 선택하도록 도움을 줍니다. 모델 유형에는 선형 회귀 모델, 회귀 트리, 가우스 과정 회귀 모델, 서포트 벡터 머신, 회귀 트리 앙상블, 신경망 회귀 모델 등이 있습니다.
데이터를 탐색하고, 특징을 선택하고, 결과를 시각화합니다. 회귀 학습기는 분류 학습기와 마찬가지로 기본적으로 교차 검증을 적용합니다. 검증된 모델의 결과는 결과값이나 시각화를 통해 확인할 수 있습니다. 결과값을 비교해 보고 데이터에 가장 적합한 모델을 선택합니다.
모델을 작업 공간으로 내보내어 새 데이터로 예측을 수행합니다. 항상 이 앱은 지정된 검증 방식이 적용된 모델을 따르고, 또한 모델을 전체 데이터에 대해서도 훈련시키고, 모델을 알고리즘 트레이딩의 이점 내보낼 때는 전체 모델을 내보냅니다.
앱에서 MATLAB 코드를 생성하여 스크립트를 만들거나 새 데이터로 훈련시키거나 규모가 큰 데이터 세트를 사용하거나 추가 분석을 위해 코드를 수정합니다.
더 많은 옵션이 필요하면 명령줄 인터페이스를 사용할 수 있습니다. 회귀 항목을 참조하십시오.
딥러닝을 위해 신경망 훈련시키기
Deep Learning Toolbox를 사용하면 분류, 회귀, 특징 추출 및 전이 학습을 위해 컨벌루션 신경망으로 딥러닝을 수행할 수 있습니다. 이 툴박스는 심층 신경망의 계층을 만들고 상호 연결하기 위한 간단한 MATLAB 명령을 제공합니다. 다양한 예제와 사전 훈련된 신경망이 제공되기 때문에 고급 컴퓨터 비전 알고리즘이나 신경망에 대한 깊이 있는 사전 지식이 없어도 쉽게 MATLAB을 딥러닝에 사용할 수 있습니다.
0 개 댓글