machine learning hackers invadiram

Machine learning identifica hackers que já invadiram



Os modelos de aprendizagem sem supervisão do Darktrace soam o alarme antes que hackers possam causar sérios danos.

Em 2013, um grupo de agentes de inteligência britânicos notou algo estranho. Enquanto a maioria dos esforços para garantir a infra-estrutura digital foi fixada no bloqueio de pessoas mal-intencionadas, poucos se concentraram no inverso, impedindo-os de vazar informações. Com base nessa ideia, o grupo fundou uma nova empresa de segurança cibernética chamada Darktrace.

A firma fez uma parceria com matemáticos da Universidade de Cambridge para desenvolver uma ferramenta que usaria machine learning para detectar violações internas. Ao invésin de treinar os algoritmos em exemplos históricos de ataques, no entanto, eles precisavam de uma maneira para o sistema reconhecer novas instâncias de comportamento anômalo. Eles se voltaram para o aprendizado não supervisionado, uma técnica baseada em um tipo raro de algoritmo de machine learning que não exige que os humanos especifiquem o que procurar.

“É muito parecido com o sistema imunológico do corpo humano”, diz a co-CEO da empresa, Nicole Eagan. “Por mais complexo que seja, tem esse senso inato de si mesmo e não de si mesmo. E quando encontra algo que não pertence, não é eu, tem uma resposta extremamente precisa e rápida.”

A grande maioria dos aplicativos de machine learning depende do aprendizado supervisionado. Isso envolve alimentar uma máquina com quantidades massivas de dados cuidadosamente rotulados para treiná-la para reconhecer um padrão estreitamente definido. Digamos que você queira que sua máquina reconheça golden retrievers. Você alimenta centenas ou milhares de imagens de golden retrievers e de coisas que não são, enquanto diz explicitamente quais são quais. Eventualmente, você acaba com uma máquina de detectar golden retriever bastante decente.

Na segurança cibernética, o aprendizado supervisionado funciona muito bem. Você treina uma máquina sobre os diferentes tipos de ameaças que seu sistema enfrentou antes, e ela persegue-os implacavelmente.

Mas existem dois problemas principais. Por um lado, só funciona com ameaças conhecidas, ameaças desconhecidas ainda se escondem sob o radar. Por outro lado, os algoritmos de aprendizado supervisionado funcionam melhor com conjuntos de dados balanceados, ou seja, aqueles que têm um número igual de exemplos do que estão procurando e do que podem ignorar. Os dados de segurança cibernética são altamente desequilibrados: há muito poucos exemplos de comportamentos ameaçadores enterrados em uma quantidade esmagadora de comportamento normal.

Felizmente, onde o aprendizado supervisionado falha, o aprendizado não supervisionado é excelente. O último pode analisar grandes quantidades de dados não rotulados e encontrar as peças que não seguem o padrão típico. Como resultado, pode surgir ameaças que um sistema nunca viu antes e precisa de poucos pontos de dados anômalos para fazer isso.

Quando o Darktrace implanta seu software, ele configura sensores físicos e digitais em torno da rede do cliente para mapear sua atividade. Os dados brutos são canalizados para mais de 60 algoritmos diferentes de aprendizado não supervisionado que competem entre si para encontrar um comportamento anômalo.

Esses algoritmos, em seguida, transferem sua saída para outro algoritmo mestre que usa vários métodos estatísticos para determinar quais deles usar e quais ignorar. Toda essa complexidade é empacotada em uma visualização final que permite que operadores humanos vejam e respondam rapidamente a possíveis violações. À medida que os humanos resolvem o que fazer a seguir, o sistema trabalha para colocar em quarentena a violação até que ela seja resolvida, cortando toda a comunicação externa do dispositivo infectado, por exemplo.

O aprendizado não supervisionado não é uma bala de prata, no entanto. À medida que os hackers ficam cada vez mais sofisticados, eles ficam melhores em enganar máquinas, independentemente do tipo de machine learning que estejam usando. “Há um jogo de gato e rato em que os agressores podem tentar mudar seu comportamento”, diz Dawn Song, especialista em segurança cibernética e machine learning da Universidade da Califórnia, em Berkeley.

Em resposta, a comunidade de segurança cibernética voltou-se para abordagens proativas – “melhores arquiteturas e princípios de segurança para que o sistema seja mais seguro pela construção”, diz ela. Mas ainda há um longo caminho para erradicar completamente todas as violações e práticas fraudulentas. Afinal, acrescenta ela, “todo o sistema é tão seguro quanto seu elo mais fraco”.

Karen Hao é a repórter de inteligência artificial da MIT Technology Review. Em particular, ela cobre o impacto ético e social da tecnologia, bem como suas aplicações para o bem social. Ela também escreve o boletim de notícias de IA, o Algorithm, que cuidadosamente examina as últimas notícias e pesquisas do campo. Antes de ingressar na publicação, ela era uma repórter e cientista de dados da Quartz e uma engenheira de aplicativos na primeira startup para sair da Google X.

Via Technology Review

Machine learning identifica hackers que já invadiram
5 (100%) 1 vote

Artigos relacionados

4 exemplos de Machine Learning e de IA que você não conhecia A importância IA (Inteligência Artificia) é comparada à descoberta do fogo, mas seu impacto depende de como somos criativos com o uso dessa tecnologia...
Finanças: Aproveitando o máximo do Machine Learning Compreendendo as vantagens e os desafios da implementação de machine learning O uso de machine learning em finanças pode fazer maravilhas, mesmo que n...
Machine learning revela subtipos de Alzheimer com ressonância magnética Machine learning pode ajudar a encontrar novos tratamentos para o Alzheimer, de acordo com pesquisadores da UCL. Um novo algoritmo que pode separar au...
Machine Learning permite métricas inspiradas na física para analisar a arte Uma pesquisa internacional colaborativa relata que uma análise sistematizada de Machine Learning de obras de arte produzidas ao longo do último milêni...