I dati della Scienza sul Lato acquisto


Con Gary Collier, CTO dell’Uomo Gruppo Alfa Tecnologia, e Hinesh Kalian, Direttore di Dati di Scienza, Uomo di Gruppo

Quali sono i dati principali sfide e punti di dolore per l’acquisto di lato?

Gary Collier, Uomo Del Gruppo Alfa Tecnologia

Una grande sfida è di ottenere e conservare dati science talent. E ‘ evidente che c’è una crescente domanda, e quindi la concorrenza, per i dati che la scienza talento in tutti i settori, non solo nel settore dei servizi finanziari. Un’altra sfida riguarda la capacità di assorbire e curato dati strutturati e non strutturati rapidamente e in una varietà di formati raw. La crescita di nuovi fornitori di dati ha portato ad un’ampia varianza della qualità dei dati offerti dai fornitori di dati; alcuni fornitori sono ben definiti e sono dati adeguati, la scienza e la tecnologia squadre, mentre altri possono essere più limitato di due dipendenti di una start-up.

Per i dati che per essere utile deve essere pulito, coerente e di provenienza e trattati in modo appropriato. Spesso i dati vengono forniti dopo alcune fasi di lavorazione sono fatto, che limita la consapevolezza dei dati grezzi e può portare al rischio di una falsa rappresentazione e la prevedibilità.

Come fa l’Uomo di Gruppo di sfruttare i dati come un vantaggio competitivo?

Hinesh Kalian, Uomo Di Gruppo

Dati è l’ingrediente grezzo che alimenta i modelli alpha e decisioni di investimento. Al fine di evitare il garbage-in/garbage-out enigma, è necessario migliorare la raccolta dei dati e l’organizzazione e creare coerente metodi per purificare, di processo e di trovare spunti dai dati.

Uomo del Gruppo di scienza di dati specializzate funzione utilizza una tecnologia avanzata per la rapida sourcing e di acquisizione di nuove fonti di dati e combina quantitativa set di abilità per filtrare il rumore, la creazione di un potenziale vantaggio competitivo in un veloce e paesaggio in continua evoluzione. Queste funzionalità di piombo per la democratizzazione dei dati, la ripartizione dei silos e l’accesso ai dati su larga scala. Come le imprese di continuare ad aggiungere a questa scala, si finisce con dati di “ecosistema” che crea la possibilità di combinare più fonti di dati, in multi-dimensionale modi, per costruire alphas e modelli di rischio.

Per essere competitivi, abbiamo bisogno di guardare il contesto più ampio in modo efficiente scoprire nuove fonti di dati per investimento test di ipotesi e di investire nella costruzione di una tecnologia all’avanguardia che svela il vero potenziale dei dati. I nostri continui investimenti nella costruzione della nostra infrastruttura di dati e l’utilizzo di tecnologie avanzate, ci ha fornito con la scala di origine, elaborare, conservare e valutare di grandi quantità di big data.

Un’altra dimensione a guadagnare un vantaggio competitivo riguarda il talento e gli stretti legami con il mondo accademico. L’Uomo del Gruppo, la nostra continua attenzione del mondo accademico, della tecnologia e della comunità open source fornisce un pool di talenti diversi modi per sviluppare ulteriormente le loro competenze. Per esempio, l’Oxford-Uomo Istituto si è concentrata su machine learning e data science nel corso dell’ultimo decennio, che collega il nostro team di ricerca con i più rinomati studiosi da tutto il mondo. Inoltre, i nostri dati e le squadre sono esposti a un mix di quantitativi e di gestione discrezionale degli investimenti stili.

Gary, sei stato con l’Uomo Gruppo per quasi 20 anni, come ha scienza di dati evolute nella gestione patrimoniale nel tempo?

E ‘ stato molto interessante evoluzione. Per i primi 17 anni del mio tempo a Uomo, ho lavorato per Man AHL, la nostra sistematica quantitativa investimento Motore. Man AHL, ora con un track record di oltre 30 anni, è stato uno dei primi praticanti di computer-driven trading sistematico. In tutta questa storia, il tema chiave è stata l’analisi di grandi insiemi di dati in modo scientifico il test di ipotesi finanziarie comportamento del mercato, e, infine, costruire automatizzato modelli per estrarre questi segnali e scambi basati su di essi. Quindi, in un senso molto reale, Uomo del Gruppo era “fare scienza di dati” nell’asset management, molto prima che il termine è di uso comune.

Ma ciò che è cambiato è stato il volume e il tipo di dati, e le tecniche e le tecnologie necessarie per analizzare ed estrarre valore. Il mondo di 20 anni fa, in genere, l’applicazione di tecniche statistiche, utilizzando la tecnologia custom ambienti (costruito in-house usando il basso livello di linguaggi come C (strutturato linguaggio di programmazione) di dati fondamentali, o semplice serie di dati come il prezzo del bene o del volume scambiato. Al giorno d’oggi, gli elementi che concorrono a “verità oggettiva” del valore di un asset di esistere in una moltitudine di diverse fonti di dati, molti dei quali non sono necessariamente numerico, sono di grandi dimensioni e contengono alti livelli di rumore. La tecnologia ha dovuto anticipo su tutti i fronti, dal basso livello di elaborazione, storage e infrastruttura di rete di trattare con l’aumento della portata del problema, per sfruttare il grande scienza di dati di potere inerente ora nell’ecosistema che circonda il linguaggio di programmazione Python.

Tecniche di analisi si sono evoluti. Di statistica e di analisi fondamentale sono, naturalmente, ancora la chiave. Ma queste tecniche tradizionali sono stati aumentati con artisti del calibro di machine learning, elaborazione del linguaggio naturale e anche l’analisi dell’immagine.

Dal punto di vista organizzativo, abbiamo anche visualizzare i dati della scienza emergendo come una prima classe di preoccupazione e di reparto a sé stante a molti gestori, e l’Uomo Gruppo non fa eccezione. La costruzione di una funzione specializzata che raccoglie una serie di informazioni quantitative e abilità operative, tra cui la possibilità di esplorare nuove fonti di dati, utilizzare la tecnologia avanzata per la rapida on-boarding, eseguire iniziale valore aggiunto di analisi e di confrontarsi con quello che è spesso un “dirty/rumoroso” spazio. Una combinazione di tutte queste competenze è necessario se si vuole rimanere all’avanguardia in un campo che è in rapida evoluzione e costantemente la produzione di nuovi insiemi di dati.

Quali tipi di sfondi cerca in nuove assunzioni? Gary ha una laurea in Fisica Teorica, un GAMBO di sfondo che immagino era insolito nel settore nel 1990, ma forse è più la norma, oggi?

Non sembra esserci alcuna specifica golden piscina, tuttavia, il reclutamento di talenti che hanno forti accademico sfondi, Master o Dottorati di ricerca in vari campi come la fisica, informatica, statistica, finanza e apprendimento della macchina ha funzionato bene. I candidati che sono suscettibili di avere una passione per i dati, curiosità, godere di analizzare i dati e di avere forti basi accademiche, probabilmente, sarà in una posizione più forte. Il candidato ideale può indossare tanti cappelli e deve avere la capacità di comunicare informazioni in dati a un pubblico più vasto. Abbiamo visto il successo dipendenti che sono un ibrido di dati manipolatore di dati, scienziato, ingegnere e communicator.

Fa l’Uomo di acquistare e costruire la propria infrastruttura di dati? O semplicemente costruire? Qual è la spiegazione per l’approccio dell’azienda?

Man Group utilizza una combinazione di acquisto fornitore di prodotti software open source e del software in-house, nel tentativo di creare un complessivo best-of-breed piattaforma dati. Per le infrastrutture fisiche, mentre noi facciamo uso di cloud pubblico, in molti modi, si privilegia un approccio contrarian, sfruttando le prestazioni e l’esperienza dell’utente finale, reso possibile dal nostro cloud privato in esecuzione sul server, flash storage e networking. Usiamo un numero molto piccolo di fornitore di prodotti software, invece, sfruttando la grande quantità di software open-source, e la combinazione di questo con un codice e “salsa segreta” per costruire dei dati ad alte prestazioni in streaming gasdotti, di storage e di calcolo distribuito e di analisi dei quadri. A differenza di molti gestori, abbiamo anche contribuire ampiamente per la comunità open-source in spazio per i dati, e sono aperti anche di provenienza di alcuni del nostro codice proprietario compreso Artico, ad alte prestazioni tick e l’ora-di serie store, e D-Racconto, un esplorativa dei dati, strumento di visualizzazione.

Qual è il futuro della scienza di dati in buy-side, front office? Come fanno le imprese a rimanere davanti alla curva?

È chiaro che il buy-side aziende hanno aumentato i loro dati trascorrere notevolmente, negli ultimi cinque anni; il numero di dati alternativi dipendenti a tempo pieno è cresciuto di quattro volte in questo periodo di tempo. Questo ha un impatto diretto sulla domanda superiore acquisizione dati che la scienza capacità. Il ruolo della scienza di dati diventerà sempre più importante per la funzione di buy-side imprese. Fondi necessario per costruire e migliorare le loro infrastrutture e la scienza di dati in grado di gestire in modo efficiente con la grande quantità di dati disponibili. Non ogni nuova origine dati fornirà il valore del tuo portafoglio. C’è un costo associato con l’approvvigionamento, la sperimentazione e la valutazione di nuove e alternative di dati. Per rimanere davanti alla curva, le imprese hanno bisogno per continuare l’evoluzione e la ricerca di nuove idee, di investire nella scienza di dati talento e introdurre tecnologie e soluzioni avanzate per il processo di dati non strutturati.

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *