Adicionalmente às condições para garantia da consistência dos dados, estabelecidas no item 3.1, foram estabelecidas regras de validação dos dados de consumo. Esse procedimento visou a minimização de possíveis inconsistências relacionadas a: erros de leitura de medidor; falhas mecânicas nos medidores; ausência de usuários, durante algum(uns) dos períodos de levantamento de consumo; e ausência de consumo.
Para a seleção das ligações, objeto das análises, em cada área de VRP selecionada e em suas respectivas áreas testemunha, foi estabelecido que deveriam ser descartadas as ligações pertencentes a economias industriais e as economias públicas. Num primeiro momento, pensou-se em descartar as economias
classificadas como comerciais. No entanto, constatou-se que, em diversas das áreas selecionadas, o percentual desse tipo de ligação era considerável e seu descarte poderia acarretar em distorções na avaliação do consumo médio dessas áreas. Dessa forma, optou-se pela manutenção desses dados, em todas as áreas analisadas.
Com a relação dos RGIs, agrupados por área, foi feita uma solicitação à área da Sabesp autorizada a pesquisar no banco de dados do CSI, para levantamento dos consumos totais médios mensais, de cada uma das 54 (cinqüenta e quatro) áreas selecionadas (27 áreas de VRP e 27 áreas testemunha), nas datas de referência dos seguintes consumos:
v1: consumo no mês anterior ao mês de entrada em operação de cada VRP; v2: consumo no mês posterior ao mês de entrada em operação de cada VRP;
v3: consumo no mesmo mês (jan, fev, etc.) do mês anterior à entrada em operação da VRP, no ano seguinte;
v4: consumo no mesmo mês (jan, fev, etc.) do mês posterior à entrada em operação da VRP, no ano seguinte.
M6: média de consumo nos seis meses anteriores à entrada em operação da VRP. Essas definições dos consumos levantados ficam mais claras fornecendo um exemplo. Supondo-se uma VRP que tenha entrado em operação no mês de abril de 2003: o consumo v1 se refere ao mês de março de 2003; o consumo v2 se refere ao mês de maio de 2003; o consumo v3 se refere ao mês de março de 2004; e o consumo v4 se refere ao mês de maio de 2004.
No trabalho de busca, nos bancos do sistema comercial (CSI), foram excluídas, ainda, as ligações com data de instalação posterior à entrada em operação de cada VRP.
Tomou-se, ainda, a precaução de se eliminar as ligações que não estavam ativas, em qualquer uma das datas de levantamento dos consumos v1, v2, v3 e v4.
Foi levantado, também, o número de economias (unidade de consumo dos serviços de saneamento) de cada ligação. Em condomínios, por exemplo, uma única ligação abastece várias economias.
Com o banco de dados contendo os consumos de cada ligação (RGI), em cada uma das datas estipuladas e para cada uma das áreas, foram aplicados os seguintes filtros:
a) Foram descartadas as ligações com data de instalação até três meses antes da entrada em operação das VRPs correspondentes (para que se tomassem apenas ligações com um consumo estável), resultando numa redução para um total de 53.921 ligações.
b) Como no levantamento dos consumos médios, nos seis meses anteriores à entrada em operação de cada VRP, não foram descartados possíveis consumos nulos, no cálculo dos consumos médios posteriores (média de v2, v3 e v4), também não foram descartados esses dados de consumo.
c) Como o objetivo da pesquisa é o de avaliar a variação de consumo, antes x depois de um determinado evento, buscou-se manter valores que fossem representativos e eliminar valores de consumo que pudessem ter apresentado algum problema de leitura de consumo ou ausência dos ocupantes da economia. Dessa forma, optou-se pelo descarte de todos os consumos inferiores a 9 m³/mês que, considerando-se uma média de três habitantes por economia, numa ligação residencial unifamiliar, equivaleria a um consumo per capita de 100 L/hab/dia, inferior à menor média da RMSP, que é de 110 L/hab/dia. Desse descarte, resultou a redução da base de dados para um total de 31.096 ligações.
d) Para a eliminação de variações bruscas de consumo, numa mesma ligação, o que poderia representar falha no registro de consumo, ausência de moradores, ou mesmo condomínios em fase de ocupação, em um dos períodos de consumo levantados, induzindo a graves erros de avaliação de tendência (o objeto da avaliação é o efeito da redução de pressão de distribuição de água no consumo e não a variação do consumo devida a outros fatores), foi adotado o critério de descarte das ligações cuja relação da diferença do consumo médio nos seis meses anteriores e da média dos consumos posteriores, dividida pela média anterior ou, a mesma diferença,
dividida pela média posterior, apresentassem valores superiores a 0,6, valor adotado como critério conservador.
Com esse último filtro, resultou um banco de dados de 28.234 ligações, sendo 16.393 internas às áreas de VRP selecionadas e 11.841 ligações pertencentes às áreas testemunha.
As características relativas ao número de ligações e de economias, das áreas de VRP e áreas testemunha selecionadas para a pesquisa, são apresentadas nas figuras 3.4, 3.5 e 3.6.
FIGURA 3.4 - Percentual do total de ligações, por tipo de área
FIGURA 3.6 - Média de economias por ligação, por tipo de área
Nessa configuração, decidiu-se pela análise comparativa entre a média dos seis meses anteriores à implantação da VRP e a média dos consumos nos meses posteriores mencionados.
Visando a eliminação de uma possível tendência de consumo ditada por sazonalidade (meses secos x meses chuvosos do ano hidrológico) e também a verificação do comportamento geral do consumo, independentemente da instalação de VRPs, foi estabelecida a comparação adicional entre diferença de consumo antes x depois nas áreas de VRP e a mesma diferença nas áreas testemunha equivalentes.