Đường cơ sở năng lượng (Phần 3): Xử lý dữ liệu đường cơ sở năng lượng

Ở các phần trước, chuyên gia ENERVI đã giới thiệu và xây dựng đầy đủ các chỉ số liên quan đến đường cơ sở năng lượng, giúp người quan lý có một cái nhìn khách quan khoa học về tình trạng sử dụng năng lượng tại đơn vị mình, từ đó đưa ra mục tiêu chỉ tiêu và các biện pháp quản lý hiệu quả.
Tuy nhiên trong thực tế, vấn đề khiến các nhà quản lý đau đầu nhất là dữ liệu thu thập phục vụ xây dựng đường cơ sở năng lượng không thể hiện mối tương quan với nhau. Tức hệ số R2giữa yếu tố đầu vào (năng lượng) và yếu tố đầu ra (sản lượng/doanh thu,..) thấp dẫn đến các kết quảthu được từ đường cơ sở năng lượng không đáng tin cậy. Vậy nguyên nhân ở đâu và phải làm như thế nào để nâng cao hệ số tương quan mẫu R2. Trong phần này chuyên gia ENERVI sẽ đi phân tích chỉ ra nguyên nhân và các biện pháp xử lý dữ liệu của đường cơ sở năng lượng.
Theo lý thuyết khi tăng sản lượng sản xuất thì năng lượng đầu vào tăng theo và ngược lại, tuy nhiên trong thực tế sẽ gặp các trường hợp sau đây:
1.  Dữ liệu có đặc tính mùa vụ: Hiệu suất năng lượng có sự chênh lệch rõ rệt vào từng mùa khác nhau, thường xẩy ra ở các quá trình sản xuất sử dụng điều hòa trung tâm hoặc lò hơi.
2.  Có nhiều chủng loại sản phẩm hoặc sản phẩm đầu ra thay đổi: Ở một số đơn vị, chủng loại sản phẩm sản xuất thay đổi liên tục theo đơn đặt hàng, mỗi chủng loại sản phẩm có 1 mức tiêu thụ năng lượng khác nhau, tuy nhiên khi thu thập dữ liệu sản lượng thông thường chúng ta cộng tổng sản phẩm dẫn đến hệ số tương quan R2 thấp.
3.  Có nhiều hơn 1 biến tác động ảnh hưởng lớn tới sử dụng năng lượng: Trên thực tế ngoài sản lượng còn rất nhiều yếu tố khác tác động tới năng lượng sử dụng như nhiệt độ môi trường, số lượng lao động,.. việc chỉ thu thập dữ liệu sản lượng mà bỏ qua các yếu tố tác động khác khiến cho độ tương quan R2 trong đường cơ sở năng lượng thấp không phản ánh đúng xu hướng sử dụng năng lượng.
4.  Khi sản phẩm tồn kho, xuất hàng theo đợt: Trong quá trình sản xuất, thông thường sản phẩm sẽ được lưu kho và xuất theo thỏa thuận hợp đồng. Có thể một lô hàng được sản xuất ở tháng 2 như đến tháng 4 mới xuất đi vì vậy trên bảng thống kê sản lượng hoặc doanh thu sẽ có hiện tượng có tháng sản lượng (doanh thu) nhiều đột biến nhưng có tháng sản lượng (doanh thu) lại rất ít trong khi điện năng vẫn ít thay đổi.
5.  Sai sót trong quá trình thu thập dữ liệu: Ngoài 4 nguyên nhân trên mang tính khách quan, thì một yếu tố chủ quan là dữ liệu được cung cấp thiếu độ tin cậy. Ví dụ vì một nguyên nhân nào đấy như việc bảo mật thông tin hay sự phức tạp trong việc thu thập dữ liệu mà khi được yêu cầu người cung cấp dữ liệu đã tự ý chỉnh sữa, thay đổi hoặc cung cấp thông tin sai lệch khiến cho việc phân tích dữ liệu về sau gặp nhiều khó khăn.
Vậy có những biện pháp nào để xử lý dữ liệu khi gặp những tình huống trên, sau đây chuyên gia ENERVI sẽ tư vấn 2 phương pháp cơ bản để nâng cao hệ số tương quan R2, nâng cao độ tin cậy các kết quả thu được từ đường cơ sở năng lượng:
Chú ý: Các phương pháp sau với điều kiện là dữ liệu thu thập được đáng tin cậy (loại bỏ nguyên nhân số 5).
Phương pháp 1: San phẳng đồ thị với hệ số mùa vụ.
Khi nhận thấy đặc tính hoạt động sử dụng năng lượng của đơn vị mình phụ thuộc theo mùa vụ chúng ta có thể sử dụng trọng số theo mùa để cân bằng hiệu suất năng lượng hay còn gọi là san phẳng đồ thị hiệu suất năng lượng.
Cụ thể xét ví dụ: Ở mô hình giả định phần 1, xưởng Utility sử dụng dầu DO để chạy lò hơi để sản xuất hơi phục vụ cho các nhà xưởng A, B, C. Ta có dữ liệu thu thập năm cơ sở 2016 như sau:
Các yếu tố Đơn vị T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 Tổng /
Trung bình
 Dầu DO tiêu thụ  Lít  188,670   117,245   84,492   133,262   110,720   119,198   108,187   146,267   112,270   121,837   142,065   195,262   1,579,400 
 Sản lượng  Tấn hơi 1,311 860 700 1,854 1,842 2,076 1,968 1,899 1,358 1,150 1,091 1,335 17,444
 EnPI 2016 sau hiệu chỉnh  kWh/ Unit 144 136 121 72 60 57 45 77 83 106 130 146 91
 
Đồ thị xu hướng và đồ thị hiệu suất năng lượng EnPI 2016: 
 
Ta nhận thấy với dữ liệu gốc đường cơ sở năng lượng có hệ số tương quan mẫu R2 rất thấp, cụ thể là dầu tiêu thụ được giải thích bởi sản lượng hơi với độ tin cậy là 0,2%. Phân tích cụ thể hơn chúng ta thấy hiệu suất năng lượng biến động theo mùa, khi vẽ đường trung bình ta nhận thấy có 6 điểm nằm trên đường trung bình và 6 điểm nằm dưới đường trung bình. Như vậy ta có thể kết luận lò hơi có đặc tính hoạt động theo mùa, ở đây ta chia làm 2 mùa là mùa đông (từ tháng 10 đến tháng 3 năm sau) và mùa hè (từ tháng 4 đến tháng 9).
Tính toán trọng số cho từng mùa như sau: 
Kết quả hiệu chỉnh sau khi áp dụng hệ số mùa:
Các yếu tố Đơn vị T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 Tổng /
Trung bình
 Dầu DO tiêu thụ  Lít  188,670   117,245   84,492   133,262   110,720   119,198   108,187   146,267   112,270   121,837   142,065   195,262   1,579,400 
 Sản lượng  Tấn hơi 1,311 860 700 1,854 1,842 2,076 1,968 1,899 1,358 1,140 1,091 1,335  
 Hệ số mùa vụ    1.5 1.5 1.5 0.7 0.7 0.7 0.7 0.7 0.7 1.5 1.5 1.5  
 Sản lượng sau hiệu chỉnh  Tấn hơi 1,908 1,252 1,019 1,359 1,340 1,522 1,443 1,392 995 1,674 1,588 1,943 17,444
 EnPI 2016 sau hiệu chỉnh  kWh/ Unit 144 136 121 72 60 57 45 77 83 106 130 146 91
 
     
Như vậy với phương pháp áp dụng trọng số cho biến ảnh hưởng theo mùa chúng ta đã nâng cao được hệ số R2 từ 0,002 lên 0.693, đây là một phương pháp điển hình trong phân tích xử lý số liệu.
Mở rộng:
Ngoài việc sử dụng trọng số mùa vụ để xử lý dữ liệu có đặc tính mùa vụ ta có thể sử dụng phương pháp này trong các trường hợp sau:
1. Sử dụng trọng số theo chủng loại sản phẩm để quy nhiều chủng loại sản phẩm về 1 loại sản phẩm, từ đó làm đơn giản hóa dữ liệu giúp xây dựng đường cơ sở năng lượng dễ dàng với độ tin cậy R2 cao hơn.
Ví dụ nhà xưởng C sản xuất quần, tuy nhiên có rất nhiều loại quần khác nhau (quần dài, quần đùi, quần lót,..) mỗi loại quần có 1 mức tiêu hao năng lượng khác nhau. Chúng ta có thể sử dụng các trọng số để quy sản lượng các loại quần về chung một loại quần. Khi đó dữ liệu của chúng ta sẽ đơn giản và độ tương quan dữ liệu sẽ cao hơn rất nhiều.
2.  Sử dụng trọng số giữa các biến tác động khác nhau để quy về một yếu tố tác động từ đó đơn giản hóa dữ liệu giúp xây dựng đường cơ sở năng lượng dễ dàng với độ tin cậy R2 cao hơn.
Ví dụ: Ngoài việc sản lượng thì có các yếu tố khác dẫn đến việc sử dụng năng lượng như số lượng lao động hay diện tích nhà xưởng,.. Bằng phương pháp tương tự ta có thể tính được các trọng số với các biến phụ sau đấy tinh chỉnh lại biến tác động chính (sản lượng) bằng trọng số. Khi đấy độ tương quan giữa các biến sẽ cao hơn rất nhiều so với dữ liệu gốc.
Phương pháp 2: Năm hóa dữ liệu – Phương pháp tổng hợp xử lý mọi loại dữ liệu bất thường.
Khi dữ liệu thu thập được có sự bất thường với nguyên nhân có thể là do việc xuất hàng theo đợt không cố định hay có sự phụ thuộc yếu tố mùa vụ hay do thay đổi quá trình sản xuất,.. Một phương pháp giúp chúng ta có thể san bằng đồ thị nâng cao hệ số tương quan mà không làm biến đổi các chỉ số thu thập được, ở đây tôi gọi là năm hóa dữ liệu (hay lũy kế dữ liệu).
Để hiểu rõ hơn chúng ta xét một ví dụ đơn giản như sau:
Ở nhà xưởng B, có dữ liệu thu thập năm cơ sở 2016 như sau:
Các yếu tố Đơn vị T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 Tổng /
Trung bình
Điện tiêu thụ KWh  255,769   177,336   256,405   243,460   428,149   411,400   421,827   480,541   420,569   561,200   689,738   457,860   5,064,277 
Sản lượng Chiếc  1,097,435   320,679   1,720,238   448,403   310,217   2,506,502   1,687,308   537,026   922,300   2,610,233   4,517,904   5,418,380   22,096,625 
EnPI 2016 kWh/
Unit
 0.233  0.553   0.149   0.543   1.380   0.164   0.252   0.895   0.456   0.125   0.153   0.132   0.229 
Xem xét đồ thị hiệu suất năng lượng và đồ thị xu hướng từ dữ liệu gốc:
   
Ta thấy EnPI có sự biến động lớn, dữ liệu có sự bất thường ở tháng 5, tháng 8,.. hệ số R2 thấp, các điểm nằm xa đường cơ sở. Khi điều tra nguyên nhân được biết rằng hoạt động sản xuất của xưởng B phụ thuộc vào đơn hàng, việc xuất hàng thường theo đợt lớn hơn 1 tháng và đặc biệt cuối năm và giáp tết nhu cầu tăng cao nên hàng xuất đi nhiều hơn so với các tháng giữa năm. Về cơ bản hoạt động này có chu kỳ theo năm nên khi chúng ta cộng dồn các chỉ số theo tháng ta có:
Các yếu tố Đơn vị T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 Tổng /
Trung bình
Điện tiêu thụ cộng dồn KWh 255,769 411,105 459,510 932,993 1,361,142 1,772,542 2,194,369 2,645,910 3,095,459 3,656,679 4,346,417 5,064,277 26,457,192
Sản lượng cộng dồn Chiếc  1,097,435   1,418,114    3,138,352   3,586,755   3,896,972   6,408,454   8,090,782   8,627,808   9,550,108   12,160,341   16,678,245   22,096,625   96,455,011 
EnPI 2016 sau xử lý kWh/ Unit 0.233 0.310 0.220 0.260 0.350 0.280 0.270 0.310 0.320 0.300 0.260 0.230 0.270
Biểu thị lên đồ thị xu hướng và đồ thị hiệu suất năng lượng:
    
Ta nhận thấy việc ảnh hưởng bởi hoạt động kinh doanh đã được san bằng bởi phương pháp này, hệ số tương quan R2 cũng đã tăng lên rất nhiều (từ 0.693 lên 0.958).
Mở rộng:
Ở trên với dữ liệu cơ sở 12 tháng năm 2016, chúng ta năm hóa dữ liệu với cơ sở ban đầu là tháng 1 năm 2016. Tuy nhiên để nâng cao hệ số tương quan và các chỉ số của đường cơ sở năng lượng. Ta có thể sử dụng dữ liệu tổng năm 2015 để làm cơ sở năm hóa cho 2016 theo nguyên tắc như sau:
Dữ liệu năm hóa tháng 1 năm 2016 = tổng năm 2015 + dữ liệu tháng 1 năm 2016
Dữ liệu năm hóa tháng 2 năm 2016 = Dữ liệu năm hóa tháng 1 năm 2016  + dữ liệu tháng 2 năm 2016
…..
Dữ liệu năm hóa tháng 12 năm 2016 = Dữ liệu năm hóa tháng 11 năm 2016  + dữ liệu tháng 12 năm 2016
Tương tự với cách tính trên, ta lấy tổng dữ liệu năm 2016 làm cơ sở năm hóa cho bộ dữ liệu 2017 sau đấy sử dụng bộ dữ liệu năm hóa có được đi xây dựng đường cơ sở năng lượng và các chỉ số liên quan như hướng dẫn ở các phần trước.
Tổng kết:
1.  Với phương pháp năm hóa dữ liệu ta có thể áp dụng được cho hầu hết các trường hợp cần xử lý dữ liệu để nâng cao hệ số tương quan mẫu.
2.  Nếu sử dụng một trong 2 phương pháp nêu trên mà kết quả thu được vẫn không khả quan. Hãy sử dụng kết hợp 2 phương pháp trên: sử dụng phương pháp 1 (Cân bằng trọng số) sau đấy áp dụng tiếp phương pháp 2 (năm hóa dữ liệu).
3.  Dữ liệu thu thập phải đảm bảo độ tin cậy và chính xác, dữ liệu cơ sở càng nhiều kết quả thu được từ đường cơ sở năng lượng càng chính xác. Thông thường dữ liệu cơ sở phải đảm bảo từ 12 đến 24 mẫu (tối thiểu là 10 mẫu).
4.  Ngoài ra để xử lý các dữ liệu có nhiều biến tác động ta có một phương pháp ở cấp độ cao hơn là hàm đa biến, trong các phần tiếp theo tôi sẽ trình bày phương pháp xây dựng hàm hồi quy đa biến để nâng cao độ tin cậy mẫu.

Tải bảng dữ liệu mẫu tại đây

Chi tiết xem trong video sau:

Các bài viết liên quan

Đường cơ sở năng lượng (Phần 4): Hàm hồi quy đa biến

15/06/2017

Trong phần này ENERVI sẽ chỉ một phương pháp nâng cao với độ phức tạp cao hơn là xây dựng đường...

Đường Cơ Sở Năng Lượng (Phần 2) Tính Toán Năng Lượng Tiết Kiệm Và Lũy Kế Tiết Kiệm.

02/06/2017

Tại phần này chúng ta sẽ tiếp tục với việc tính toán chỉ số tiết kiệm năng lượng đạt được...

Tổng quan về đường cơ sở năng lượng

02/06/2017

Đường cơ sở năng lượng là điểm khởi đầu để đo lường hiệu suất năng lượng theo thời gian. Nó được...