sexta-feira, 28 de agosto de 2009

Localização, Localização, Localização

A nova tecnologia de geolocation do Help Saude já está no ar. Agora você pode procurar por Bairro, CEP e etc. Pode até determinar a distancia da area padrão que devemos incluir na busca, por exemplo Hospitais até 10kms do CEP. Para fazer isso mapeamos todos os endereços como pontos numa base geográfica de coordenadas e determinamos regiões de abrangência para cada CEP, Bairro, Cidade ou Estado do Brasil. Se seu resultado está muito restrito você sempre pode aumentar a abrangência na barra lateral. Para começar faça uma busca qualquer e depois vai definindo a região nos filtros laterais.
Podemos imaginar que cada localidade (Estado, CEP, Bairro, etc) é um polígono geométrico num plano. Cada endereço é um ponto no mesmo plano. Ou seja, todos os pontos contidos num determinado polígono são considerados da mesma região. Desta maneira, quando você procura um profissional de saúde num determinado CEP ele retorna todos os endereços próximos daquela região geográfica.
Os polígonos que representam cada localidade são na verdade uma aproximação daquela região no mapa, é como se você marcasse com um compasso um pedaço do mapa como "Copacabana", sabemos que Copacabana é uma forma geométrica incerta, certamente, você vai incluir, um pedaço de Ipanema ou Leme. Sendo assim, as buscas geográficas não são exatas, o que é bom, pois o que queremos são endereços próximos, a fronteira de um bairro não é tão relevante assim, é só um ponto de referencia.
Na prática os resultados não exatos (endereços próximos) são mais úteis que os exatos (endereços que especificamente listam Copacabana na sua escrita).
A mesma vantagem aparece quando um endereço aparece listado com bairros diferentes. Observamos que em muitos lugares há variações quanto ao bairro considerado. No Rio de Janeiro, por exemplo, a Rua do Catete aparece como sendo no Flamengo, Catete ou Largo do Machado. Independente do Bairro descrito pelo estabelecimento essa rua vai aparece geograficamente no ponto correto e será resultado da buscas onde ela deve aparecer.
A maioria dos sites de plano de saude amarra suas buscas no bairro descrito o que obriga o usuário a fazer diversas buscas para coletar o resultado desejado. Com essa nova funcionalidade damos mais um passo em ser o melhor sistemas de busca de profissionais de saúde do mundo.

terça-feira, 14 de julho de 2009

Tecnologia de Busca do Help Saude

Eu queria falar um pouco sobre a tecnologia por tras do Help Saude, o primeiro projeto da startup que estou trabalhando atualmente.

Quando resolvemos criar um site de referência para profissionais e estabelecimentos de saude sabíamos que para atender bem aos usuários precisaríamos de uma tecnologia de busca super moderna. Iriamos receber grandes quantidades de dados de diversas fontes diferentes e tinhamos que digerir e normalizar tudo isso de modo que fosse fácil para os usuarios encontrarem os profissionais por nome, endereço, etc. Queriamos tambem opções de ordenação por proximidade, projeção em mapa e etc.

Por isso investimos bastante em desenvolver uma tecnologia propria, usando os algoritmos mais modernos. Investimos em busca fonética e "fuzzy matching" pois nessa area há muitos erros de digitação e dificuldades para ler e soletrar nomes complexos como "schutzenberger". Estamos incorporando tecnologia de steaming para desconsiderar sufixos como "logia", "logista" e re-interpretando os logs de busca para observar o comportamento dos usuarios e os tipos de busca mais comuns.

Alem disso temos sistemas de refinamento da nossa bases de dados pois muitas vezes o mesmo profissional aparece listado de diversas maneiras diferentes em fontes dados distintas (diferentes planos de saúde, por exemplo).

Ainda temos muito o que fazer para atingir nosso objetivo de ser o melhor sistema de busca de nicho do mundo portanto fiquem ligados nas novidades. A proxima etapa é colocar mais funcionalidade de geolocalização e mapeamento inclusive ordenação por proximidade assim vc pode facilmente procurar o medico mais proximo. Veja um teaser do que imaginamos nessa busca com CEP.

terça-feira, 9 de junho de 2009

PL 29 Continua Péssima! ou Eu quero meu Partido Pirata!

Fiquei extremamente decepcionado com o projeto de lei sobre TV por assinatura. Acreditar que cotas de programação vão incentivar a cultura é esquecer totalmente o que foi feito no governo militar, é repetir uma formula falida que só vai trazer transtorno e prejuízos para a industria como um todo.

Fiquei admirado em ver gente que eu considerava forças políticas coerentes defendendo idéias estúpidas e contra nosso povo. A tal PL 29 tá amarrada a meses e meses, e não está ficando melhor... Pelo contrario ta piorando muito dizer que "serviços audiovisuais na internet devem ser sujeitos à autorização da Anatel" é uma das idéias mais retrogradas e idiotias que eu ja vi na vida.

Cotas e regulamentação excessiva vão limitar a escolha e impedir o crescimento da oferta e da concorrência, em ultima analise, prejudicando o consumidor e favorecendo os grandes monopólios nacionais de comunicação.

Estamos caminhando para um mundo de super oferta de conteúdo onde a tecnologia permite a criação de um número praticamente ilimitado de canais e onde qualquer um com um equipamento bem barato pode fazer um filme ou um programa. Qualquer empresa pode oferecer ofertas segmentadas para todos os gostos. Querer colocar cotas é o mesmo que impedir a criação, ou melhor, o acesso ao conteúdo vasto que existe.

Trabalhei numa empresa que vende musica pela internet. Obviamente o conteúdo nacional está entre os mais procurados, mas o nosso catalogo era vasto e por uma simples questão numérica o catalogo tem mais estrangeiros que Brasileiros. Nunca recusamos nenhum conteúdo mas simplesmente existe mais gente produzindo musica fora do Brasil do que no Brasil. Se tivéssemos um quota, qualquer que fosse, o conteúdo só diminuiria porque tínhamos todo conteúdo nacional possível. Os seja, os prejudicados seriam provavelmente os compositores chineses ou africanos que estão hoje no catalogo mas tem menos vendas que os demais. Eles teriam que ser removidos para nos enquadrarmos nas cotas, sem qualquer contrapartida positiva para os clientes. O custo do armazenamento é ridículo e não existe uma boa razão para limitarmos a oferta de conteúdo.

Exatamente como o catálogo de música tem potencial para serem ilimitados, é para isso que a indústria do vídeo está caminhando. Video on demand, qualquer programa, na hora que o consumidor quiser. Ou um numero praticamente ilimitado de canais digitais... Limitado apenas pela audiência e escolha do consumidor e não pela tecnologia.

Todos teriam acesso a divulgar seus programas. Regular isso é tão idiota quanto regular a oferta de conteúdo na internet ou arbitrariamente limitar o acesso aos pequenos. Ou seja, é a coisa mais antidemocrática a fazer. Sugiro que todos os deputados leiam mais sobre a nova industria de conteúdo que está surgindo. Leiam Livros como "Long Tail" e "Free". O que os bons produtores precisam é de menos impostos e mais incentivos a produção. Canais de distribuição não é um problema.

Alguém realmente acredita que faltam canais para exibir programas nacionais? Se acha que falta canais crie novos canais e não atrapalhe a diversidade tão rica que a TV pode se tornar. É o mesmo que dizer que tem poucos sites em português na internet, portanto temos que limitar o acesso aos sites estrangeiros... Não tem lógica é uma dialética estúpida.

O que acho mais triste é que o Brasil tem tanto partidos políticos, mas todos estão ficando cada dia mais parecidos, não há quem defenda idéias. Todos abraçam uma demagogia, oportunística e irracional.

Todos os partidos aumentam impostos, todos aumentam o tamanho do estado, todos criam políticas excessivamente regulatórias, todos querem regular a vida privada e a escolha dos cidadãos como se fossem o pai repressor da população. Como se fossemos crianças sem discernimento para escolher nossas amizades, programas de TV, jogos eletrônicos ou fontes de informação...

Eu votava nos partidos de centro-esquerda porque era a favor da liberdade e a favor de políticas sociais responsáveis, agora a esquerda virou governo e faz o mesmo que a direita fazia... Paternalismo e defesa dos oligopólios nacionais...

Esquerda e direita deixaram de fazer sentido, eu cheguei a pensar em mudar pro lado oposto da moeda, votar em algum "Republicano" que quisesse baixar impostos e desregulamentar a economia. Todos sabem que o Brasil precisa de um pouco disso no momento... Porém nem tenho essa opção... A direita Brasileira também aumenta impostos e cria regras protecionistas sem sentido (Acho que todos devem lembrar-se das leis de reserva no mercado de informática e o atraso que esse período trouxe para o Brasil)...

O que eu faço??? Quero um Partido Pirata no Brasil!

Techcruch vs New Your Times

Ler sobre a briga entre a Techcrunch e o NYT me fez rir bastante. É muito engraçado ver um dos blogs mais famosos do nosso meio reclamar da pratica jornalista mais comum do mundo. Sendo que ele se sentiu injustiçado pelo New York Times um dos jornais mais respeitados do mundo... hehehe

Quero deixar claro que não dou razão para nenhum dos dois. Na verdade, ambos estão errados e ambos estão certos... Ambos fazem exatamente aquilo que dizem que o outro faz.

Já trabalhei em jornal e nunca vi um jornalista sem opinião. O que o NYT fez é o mais comum, e é exatamente como um jornal funciona. Primeiro se decide sobre o que se quer escrever ou qual a pauta do dia. Depois ele sai para procurar alguém que corrobore e confirme o que ele quer falar... Procura-se até achar ou simplesmente só escuta-se a parte da entrevista que se quer ouvir.

Eu não sei se isso são ossos do ofício... Se já está implícito no funcionamento do jornal ou se são apenas humanos... Provavelmente todas essas razões.

De fato a única lição que podemos tirar disso é o que eu aprendi trabalhando como Analista de Sistemas num Jornal, observando como os jornalistas trabalhavam, dando entrevistas ou pareceres técnicos... Não existem mídias ou jornalistas imparciais. Todos mundo tem opinião e gosta de estar certo.

O melhor que você, ou eu, leitores podemos fazer é ler varias fontes e formar nossa própria opinião. Descartar os mais toscos, os mentirosos ou aqueles que nem se preocupam em defender suas idéias com uma argumentação coerente. Tentar ler opiniões de quem entende do assunto e não de celebridades que gostam de falar sobre tudo... Bom jornalista não é quem não tem opinião mas quem não mente sobre ela, nesse ponto o Techcrunsh não pode reclamar, a opinião do NYT sobre os blogueiros já estava feita e clara muito antes dele escrever essa matéria, ele que foi inocente de achar que o NYT seria muito diferente dele mesmo, só porque ouviu ele antes de escrever.

Achar que o NYT está sempre certo ou verifica totalmente sua fontes é ilusão, achar que um blog que é obrigatoriamente menos confiável é acreditar que papel tem juízo critico ou não aceita que escrevam mentira.

terça-feira, 19 de maio de 2009

Carta aberta aos proponentes de Lei Azeredo

Como eleitor e perito em internet. Gostaria de reclamar do texto da chamada Lei Azeredo do qual os senhores aparecem como apoiadores.

O texto de lei em momento algum contribui para melhor regulação da internet, não há incentivo ao investimento, nem inclusão digital, segurança ou inovação. É um verdadeiro desserviço ao pais e coloca na mão das pessoas erradas informação e controle que só deveriam caber a policia.

A lei parece escrita por pessoas sem o menor entendimento da internet tentando agradar a bancos, gravadoras e estudios, criminalizando, desproporcinalmente, atividades mal definidas misturando crimes junto com diversas outras atividades comuns.

Sem falar na falta do que realmente interessa a todos como garantia de neutralidade na rede. Isso sim que é importante.

Sugiro que se faça uma revisão completa no texto ou se comece um novo projeto do zero. A maioria dos crimes cometidos na internet já estão previstos nas leis atuais. Pedofili, pirataria, invesão de privacidade, calunia, nada disso precisa de mais legislação muito menos de agravamento pelo simples fato de usar-se a internet.

Se a policia precisa de mais ferramentas de atuação e acredito que precisa, isso sim deveria ser discutido, a mesma lei de escutas telefonicas pode ser aplicada na internet. Aos provedores e concecionarios de serviço cabe apenas indicar as linhas e conexoes fisicas usadas pelo investigado. Profissionais qualificados que deveriam ser contratado em numero suficiente dentro da policia poderiam colocar escutas nessas linhas e ai sim registrar evidencias de crimes cometidos na internet.

Não há valor no suposto registro de acesso na mão dos provedores. Esse registro só serviria para incriminar pessoas inocentes, que tiverem suas maquinas invadidas e usadas para fim maliciosos e coloca informações sigilosas na mão de empresa pouco confiáveis e sem condições de garantir sua segurança. É o mesmo que pedir para o carteiro copiar todas as cartas enviadas caso alguem mande uma carta bomba ou ameaça.

Nada alem do que já existe hoje (registro do IP de cada cliente do provedor) é necessario ou útil e constitui apenas mais risco.

Mais uma vez vejo a camera e o senado brasileiro aprovar lei sem o menor embasamento tecnico ou debate sobre as reais necessidades da sociadade. A exemplo da falida lei que obrigava a existencia de kits medicos nos carros.