From 2b8cfd769a3e829c8421be580913510d0a15b512 Mon Sep 17 00:00:00 2001
From: Sofia Guerra <sofia.guerra@jam3.com>
Date: Thu, 4 Aug 2022 17:14:12 -0300
Subject: [PATCH 1/5] Adding blog post

---
 ...-xeon-scalable-processors-with-bfloat16.md |  76 ++++++++++++++++++
 ...xeon-scalable-processors-with-bfloat16.png | Bin 0 -> 33115 bytes
 2 files changed, 76 insertions(+)
 create mode 100644 _posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
 create mode 100644 assets/images/empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png

diff --git a/_posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md b/_posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
new file mode 100644
index 000000000000..4d991e8e2430
--- /dev/null
+++ b/_posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
@@ -0,0 +1,76 @@
+---
+layout: blog_detail
+title: "Empowering PyTorch on Intel® Xeon® Scalable processors with Bfloat16"
+author: Mingfei Ma (Intel), Vitaly Fedyunin (Meta), Wei Wei (Meta)
+featured-img: '\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png'
+---
+
+## Overview
+
+Recent years, the growing complexity of AI models have been posing requirements on hardware for more and more compute capability. Reduced precision numeric format has been proposed to address this problem. Bfloat16 is a custom 16-bit floating point format for AI which consists of one sign bit, eight exponent bits, and seven mantissa bits. With the same dynamic range as float32, bfloat16 doesn’t require a special handling such as loss scaling. Therefore, bfloat16 is a drop-in replacement for float32 when running deep neural networks for both inference and training.
+
+The 3rd Gen Intel® Xeon® Scalable processor (codenamed Cooper Lake), is the first general purpose x86 CPU with native bfloat16 support. Three new bfloat16 instructions were introduced in Intel® Advanced Vector Extensions-512 (Intel® AVX-512): VCVTNE2PS2BF16, VCVTNEPS2BF16, and VDPBF16PS. The first two instructions perform conversion from float32 to bfloat16, and the last one performs a dot product of bfloat16 pairs. Bfloat16 theoretical compute throughput is doubled over float32 on Cooper Lake. On the next generation of Intel® Xeon® Scalable Processors, bfloat16 compute throughput will be further enhanced through Advanced Matrix Extensions (Intel® AMX) instruction set extension.
+
+Intel and Meta previously collaborated to enable bfloat16 on PyTorch, and the related work was published in an earlier [blog](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659) during launch of Cooper Lake. In that blog, we introduced the hardware advancement for native bfloat16 support and showcased a performance boost of 1.4x to 1.6x of bfloat16 over float32 from DLRM, ResNet-50 and ResNext-101-32x4d.
+
+In this blog, we will introduce the latest software enhancement on bfloat16 in PyTorch 1.12, which would apply to much broader scope of user scenarios and showcase even higher performance boost.
+
+## Native Level Optimization on Bfloat16
+
+On PyTorch CPU bfloat16 path, the compute intensive operators, e.g., convolution, linear and bmm, use oneDNN (oneAPI Deep Neural Network Library) to achieve optimal performance on Intel CPUs with AVX512_BF16 or AMX support. The other operators,  such as tensor operators and neural network operators, are optimized at PyTorch native level. We have enlarged bfloat16 kernel level optimizations to majority of operators on dense tensors, both inference and training applicable (sparse tensor bfloat16 support will be covered in future work), specifically:
+
+- **Bfloat16 vectorization**: Bfloat16 is stored as unsigned 16-bit integer, which requires it to be casted to float32 for arithmetic operations such as add, mul, etc. Specifically, each bfloat16 vector will be converted to two float32 vectors, processed accordingly and then converted back. While for non-arithmetic operations such as cat, copy, etc., it is a straight memory copy and no data type conversion will be involved.
+- **Bfloat16 reduction**: Reduction on bfloat16 data uses float32 as accumulation type to guarantee numerical stability, e.g., sum, BatchNorm2d, MaxPool2d, etc.
+- **Channels Last optimization**: For vision models, Channels Last is the preferable memory format over Channels First from performance perspective. We have implemented fully optimized CPU kernels for all the commonly used CV modules on channels last memory format, taking care of both float32 and bfloat16.
+
+## Run Bfloat16 with Auto Mixed Precision
+
+To run model on bfloat16, typically user can either explicitly convert the data and model to bfloat16, for example:
+
+```console
+# with explicit conversion
+input = input.to(dtype=torch.bfloat16)
+model = model.to(dtype=torch.bfloat16)
+```
+
+or utilize torch.amp (Automatic Mixed Precision) package. The autocast instance serves as context managers or decorators that allow regions of your script to run in mixed precision, for example:
+
+```console
+# with AMP
+with torch.autocast(device_type="cpu", dtype=torch.bfloat16):
+    output = model(input)
+```
+
+Generally, the explicit conversion approach and AMP approach have similar performance. Even though, we recommend run bfloat16 models with AMP, because:
+
+- **Better user experience with automatic fallback**: If your script includes operators that don’t have bfloat16 support, autocast will implicitly convert them back to float32 while the explicit converted model will give a runtime error.
+
+- **Mixed data type for activation and parameters**: Unlike the explicit conversion which converts all the model parameters to bfloat16, AMP mode will run in mixed data type. To be specific, input/output will be kept in bfloat16 while parameters, e.g., weight/bias, will be kept in float32. The mixed data type of activation and parameters will help improve performance while maintaining the accuracy.
+
+## Performance Gains
+
+We benchmarked inference performance of TorchVision models on Intel® Xeon® Platinum 8380H CPU @ 2.90GHz (codenamed Cooper Lake), single instance per socket (batch size = 2 x number of physical cores). Results show that bfloat16 has 1.4x to 2.2x performance gain over float32.
+
+<p align="center">
+  <img src="\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png" width="100%">
+</p>
+
+## The performance boost of bfloat16 over float32 primarily comes from 3 aspects:
+
+- The compute intensive operators take advantage of the new bfloat16 native instruction VDPBF16PS which doubles the hardware compute throughput.
+- Bfloat16 have only half the memory footprint of float32, so theoretically the memory bandwidth intensive operators will be twice faster.
+- On Channels Last, we intentionally keep the same parallelization scheme for all the memory format aware operators (can’t do this on Channels First though), which increases the data locality when passing each layer’s output to the next. Basically, it keeps the data closer to CPU cores while data would reside in cache anyway.  And bfloat16 will have a higher cache hit rate compared with float32 in such scenarios due to smaller memory footprint.
+
+## Conclusion & Future Work
+
+In this blog, we introduced recent software optimizations on bfloat16 introduced in PyTorch 1.12. Results on the 3rd Gen Intel® Xeon® Scalable processor show that bfloat16 has 1.4x to 2.2x performance gain over float32 on the TorchVision models. Further improvement is expected on the next generation of Intel® Xeon® Scalable Processors with AMX instruction support. Though the performance number for this blog is collected with TorchVision models, the benefit is broad across all topologies. And we will continue to extend the bfloat16 optimization effort to a broader scope in the future!
+
+## Acknowledgement
+
+The results presented in this blog is a joint effort of Meta and Intel PyTorch team. Special thanks to Vitaly Fedyunin and Wei Wei from Meta who spent precious time and gave substantial assistance! Together we made one more step on the path of improving the PyTorch CPU eco system.
+
+## Reference
+
+- [The bfloat16 numerical format](https://cloud.google.com/tpu/docs/bfloat16?hl=en)
+- [https://pytorch.org/docs/master/amp.html#torch.autocast](https://pytorch.org/docs/master/amp.html#torch.autocast)
+- [Intel and Facebook Accelerate PyTorch Performance with 3rd Gen Intel® Xeon® Processors and Intel® Deep Learning Boost’s new BFloat16 capability](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659)
\ No newline at end of file
diff --git a/assets/images/empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png b/assets/images/empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png
new file mode 100644
index 0000000000000000000000000000000000000000..688d117520f3f4be4278bdc0a9b0b1437a2c18a3
GIT binary patch
literal 33115
zcmd431yogQ*EURp(ui~$pfn;NT^m#oK@{m0kVd+@OAG`>Qb44oK}uRlm5?qGq`To?
zYi(sCM?IeR|K2g)F`kFB*?aAK%{Ak?t~u{p0_EkTagS3RM?ylvy>eOd1`-l#ArcZY
z6&4Ecj*Ca7Iq)B3>l@PINLj5^Q@}51hGN&mkdSi2v3GRPf!~i=URJS2LL#yO|BpOq
zK<j{n<gsu?QtYOK=4|<Nw#}x-K$8~tdUUe`8%~16Wz5U|Hgqj#p2zC+Ka9;4SRh+?
zoPvu>;x^Ji#QpYluZK_XsS>rw5SI1kVf~mjAGcQQ_23t08XD=meJ@sXktm#YsL6OW
z^vcyPvoxbTc59ZutaZ~Z-zI<hbw%ZFnfrPc|5uj=EmD{QG59~u#2e#@OhMrPdj7Ax
zEFN?Dve!4XM$J69_c?nZO_w6h)!BqsI4014GCuc<AY+OCEA*g52eR`pwji10*&S31
z=RS!q#oY>ncKaU`^<Q{fn55AgFRyK;TSxYrxMRA0*-J?@DHL#j&((G%>#5WA{%jY!
zhcR)fn2)BPKJ46VX-9eXEt`yYcMU7Uq&2bF2wWH&_TYt7%tYbJ$WoqO&O@3O&2-1t
zZDx2j?G=MVF^z>^K0P!&6M9`+eN9Py*3(hVfYu3PT5)m^MIbr9+iqJwwJ#{Km=0RW
zmy*kVuf;6WMp5{pt1@2Z*=JksU-H(6c$~fNh1Cnl*DLj|J>FKc9V(1*dLVF&A=aU<
zZ{EG|@ui^m$d}$MGiybcY_8`BVO?G)sZt-K)-80wt}rJP9(wob!nvT)2QP_BnAnI7
zPWNx}Ixj5{^sR0kGyPbDIcV~}Z*Dnnp=ij05X*jfQMzu(lf`;jC)YutxwQ6HR_%KB
zyU+UH(xsn0(ziK3du{eE#+yBTw`uRqk-q$NQObtFt7h8H8RF)Zug@9T7<Ug!aN>)I
z1aY+zox!K1p<&&9THaETc0-SOz?j`^Yi3K*j`g0d|CYT4ubDI@44KG&I|R=v<7sz7
z7Nvy+d&W@ZMPkgSigLPHBuE0O6(hsgFa>p-#|)%(zKPG)pBA1eiqV#JcI$i12ook!
zeB)qVL_AW}gyT41u7atliphU7&BTv|IHUs0>BS9yT{#m`u0ottZb3m^a=w+=*{?-J
zmDKMCQ`Cem3Fn?-%v1dG`1X*9utgdNZRPB&1f#mv=?L%SW#5)<-UxfS!1<oAyjwx4
zU71|MALUp%+}PFJg4ebxZUZ5MvI-l<Gr#ITWF|e>8&}D7m4GL$(da8pxzjHHSi4iB
zz?)JhKYUe#($(ty+Z9WnuNCr__FY2jw`R0rUicO}^zHN7c<fcP+=|fhuzX$h_OpgG
zx4+3ZOSGA6hqOk=+6lTj6t5uTmaWnRmU+gqI=s~-7vfiHPcZMj>5-e=aY8SLHA@S<
z;p&k6gV_=xp$f-_)^oG5wY}x+8?n}xRkh2gO33bu1GdUT>2;?kVAH{a-Som$g0-1d
zoY$+`b#nJO*UZbEx4&dcH}Xo+YI_?*cqADKq$2m0`OX%FD7%VQI@R!(#%>bq$v1o7
znF<W0eQ$E3G4@0DXUA`s`*DdPQ{S|4IoagLqYmUNdg4-K2o1imnD(KNmZ1&vA0^Xy
zw)zbJIbo0RF|PApCojEVMdCr7<sX+{6q;uX8cl>U@{tbv#F)w2#4%>TDz!@z&K#!m
zed|4TZ`8VGpGb#y&5xQDW<IkfvLw!=UaFrye@sQ_J!8Yy3iP*`R4&nHGKX5dl+)LY
zY|Nc?X`EsQue}%<`PNbRbt}0h8J~Ol?2KLBa-E%^mkzJhTFkq8z}Oe@t0Scex2x-s
zU%c>~y&;vF<8(@VzBud=9$A*_rs1qf+YE`zLP(V+zC`vr@^}40{;MM|NR-{PsxdQc
zotbH8gz^%Z*ut(x1doc7-yjmEsSb6oHTXKz#40s~+GDz*x3Q)%A8EV&r6Xy;`m;ON
zn9(;Ckupjn>n@YE=Uc_`X38@OQU0+*r0?F?yjbznn<p=NA8^W$A#yRP27R{6;e_^#
zibw%tqvzM;SbrHUPJUG35@)$F)yoS~d5tpVYQyaU>w=a0EWwGzSl@Ajx5!Gzmee8!
zJ7n2AQ^Pq%IAi18q`OE)#n77)wZew7I|FWxI|01Jx8KapT4*`0#Wt@6nnwEx*f}#_
z%voJp<;~+oFL!;}^HK>@kH)z|DDS)u_2z~Q5JkS883AfZ)gBY6)sw+IGYNattu(n(
z187;(o%}b0FeFsA_i-AlMvT4e5{FA)Z##=gwMLOhXnq?+87m4?b$eMAP;RI~TnCds
zcTa)1=-DaqPV(Z<AA$iQ@qYnQia9S(+5p3Fg8#89O9L<}C@}#3ACPYf!5o2j=l{@4
z-E%IBNo|5l8&|JaZl$^y*X%v1*egk0F9%KKivThsktwpeTVy>Uawdyt=t)JfTNstY
zR4}dU$iwW4o1iOT_F(7|l_@OTCKpMCH*JM`3|2l+vI{MB@Gj;hH)`!LSuncKc9JT!
zf$m|1{8#sOW9w^d#d=BhVl_`U`|cFue5M7X#f|Z6Yawxc_VJ)wW1zc}px+ykD7v4m
zwbh%>&T*kaE~0xqd^)`eSV{=;sIC~!(374!D@6D1?5)uh>>0q48-WkY;UCgx5DlRo
zn;UuJSJt?5t>V;>9$+g|$_>!+IxdH?<i*gDTcc&~oVqvX=44Qlw7R$3DbpFhb*}=K
z$$dSmIBv1?Ic~qBdtW2%=K061DcAS8mS<AkmRTLA!YlT=g6CZ(BJ3-cwi{y4J-(WZ
zeS%0XCH9ytX$jLD|Mos(-P5&!uE#v~XZ(3Z?oD22BbJ$HjMFq9YIo4vY2dbt1K3P%
z*>byX?issR*<*(5^S#sln1k-#lBhQ2O$F=S-6z-|e8!yZaKD}FXt2DhBxt=$+OUzk
zH!xzyLPv?`a%ZzNm^UO=3_HIx<Ge$8BQea1H()K8SF^YO%B7rMD(y?mvl>?;lCsJt
zwz64Ry)sDbIm1hC#n`qRQ)LL(1l8yfJ3VK}9(3`)m(rK(funB!g{Q2|Lg?f9fVe(Z
zdE&Z(xAUZ9hB=CKC!_PVSnej5Khw%z(C7=hZCdF6B^l*}ac*AUK!VRiA?JSl06D93
zu(GeJR<;FOd2isz*MX*J^J<iP4g#OaF_vU0k<@Hif=07Abt=iSZJ(iY^s<|~C6_-u
zx8##$)_~MPos8nJpFp{nj%PxP8G_N0!0VjyNq4$vxS?C~1g23g*#uR-$=bLqa1Y$x
z@QRYHl1sF2R_^O<h)0*R8(<pR=2Y4lGq&}Y%&`TDM;B`in@M22eaxXON|N(ou$tJ>
z_<W8*`eWB_DOv(5$2>z-*82?87yErwiIJzzh~5agn11?RIUCNk^6h4Q=uQ)|Ww04m
z8(qR8-_P5+21=*adM?eF%BZzj=JvAa!W8<2&d!m}7BAL?->ZvygTtnqTyA~t-lu{-
zSAv2vb9(8wcosCRX1Cfq@Uc?5bRRL`XJ>g0CHNR9bx{|sukYHsUmMYJw?b|fG{XNX
zE6{D5Zgj81w&7liH7i|S?rPJAcJIvj_P}oTOpB(;3orLpGvkv?KJ8@Gn>pE*uJ6JW
zWY6}nXOS0HHf`65EA<LIW=Pd28wgf7@4;)4T_;^?y)r>UCDPY4b0)2B^#XIZu|=@4
zf~-zzc6D*Eno{m|a}HX@#B#N%-kz8<i(zRiE6>*)e%cC0jcFxP%Y2d|?+a{nzB&UT
zC$i-_mRt<-a7bW_mXh0b-;&p4)o2*!NU>G#&ff@%Nk$n<wu3!59`9XXQBVG1LwWGc
zabaP9jkl`#9?Y3-m(pOIxcU37!b0Yn`Ik!d)}vc$>#wuXI`a+1vr=`E%8XTgqAc|=
zbKB)%D|DzRPu)r+%YD~eZ*8aDHiMBqRk<5tr~uQR9=YH=<gN#1;KRx+-V2in1Dryd
z#dip4D;+!279TO0KXTpX?oMktt<}~uVEC#mSa0W{R&kJI-+<20C(8NYns2>ldpYLM
zYCO-vB6>PtNK!*?Y=s@9j2{>nCzGM#TC#R)Z+`tQOJ)GCNd9)A?z5{A+pnM2Z)2`}
z<GL(N*W-9$DDUDGbN1>7_Tw$QZF|I<Pe;0mF_yH{nNlp(q(1pEx{sVEGPCzjyPZ0X
zOt4QLdAiSGW2ijVxji<4q$nxi;<gmA-@A77Nn*`A3F_*B<<&bU+lsswPxiWz-1JFl
z6eG0vdnOxExoGIlwlBFox>}-T5v=-Av2wGE)^+M}DvkSI9ebwc?h1Q&?9jTwn~~i(
zwesb4_vKA#w@vI2M}bw}^&}PH^>>Q%E??HaoZ-ffQ?E4awDBK$gO(5+9@ArMYZt2$
z8mhIwVtY|0b&@3XWoYcq@U7FiLoWxN7N56GHfotDWBA{;)rrX(Q?xkg*g2pq=igYf
zXdL?d#%KjYJ+eQ{`BWIEpu0wUb={7-x80y>MnM$=&%8)^Ky|?}-;vN{=gw=-KB(C)
zSnuu-vcAOfd633i5`azo0~CudrD$FE?s!IOox7c~hmI68J|X9~^Yrc91&P_Y`ZHyf
zYF(Nd1sIgZ$vPaeqodNFNcK0pZ$}uFIpPg1mzghjIw-H!&1qCk%}mdk@I*AYz6;a5
zCM8>Q><kT=0)^%9)-EfbTPbBUX3*p%Ba18&-WzCmUFi)33ojV#M4lASJ#S&v%;A4{
zZn{%9h^(X6(3ZO(KtLk7v95*Fu}Lj=b)rc|GZ(9C_adiZDMp*+NbI{=3WW#AY8{0H
zYpZp3_SyXF{3n&y@i3~|rN_ehkcA4$hfdw=o4AcRyP3c&-Bew=qC~)_TKlxTfG^6-
zG_>c|g8wxme*9j_S9PHzxo+;1M5!cJEn5Qj)Xrq(&!x#Qdo_e+l5-}1w}Oz>vCkqa
z+Qo5Zc5a%n$gbt&vnMHEWKGPw1GX0NHDQTn^fU9=h0E=PW5NSAD-YOi<9*WAjxjU+
z^7^CnCvuG0(9Y4P7f3rq#Z)Hj-vmrw7v#Yya?nx7?dGxRW~bKmgk>;f>&dZ?w&uJf
zb}VO_nO4QI37LP)la1H5A*RI=Id(xM^35#ob&aK<FP8CTYPZF^9jl(|I16l=f4=zS
zVxrs5X8PrPRv%Q?T-DMdH*53jY{l^ve8P!Yd7-yh3+2e_*^XU%BIZ0+z-LHk@g~3A
zT$TkT+dRDHu}MzRSNpEGj`<H7_ygWg7T=#w#EqS{mt!3@&y68=6mns7BX<5!Y0gGc
zW7{?-!DiQBVNgk{wG`xQ6<=n5F9m~t-N|@e4!w)TO>(zq8AuA5`y!Nvus-6oRrD>Z
z$=XFLy+-s@yY)9{pX-f{LI*=G;J*%a#kFlo^IpR#P*x^P;w@?v(;}|p!QM_p_uHP+
zwc0&>Lth2Em|q(&e>H!i%6H+ujHa_St0QSs#ph5ODy{^H2JOy{vxcR<r>=5oGxrjW
zx7Dk3@c5z*2yxHn7(JvXRbM4_3NqQwOo^->eH|fV#N5l~FLOD9mr`Giw6NICUG4g!
zwX!_U2WzGLlXWfhdLM!c(E_zWqg&=sFMYIg%D+lV^5nu50p*U!g(MO8lYxb3n|W4B
z`Q+TuYU|q5Wu1(kE>ryU=53Z!S<Tr@Z0IFEg^8?UBsZ9Q`K`#$agkihc$^-mmTf+8
z)BNsA$F{86<u;X$LJoaP<qjqFvs`C00Y6~@>ph4$X6j!2ra9(HZ#7^<lLz=gWuOjB
zO@SCavif=Y<k-Qw$mh7$>gX4#X~X9(Wd<mYKW`Oa>m~8S!DH?foUXm2rN!|~CB0zn
z+lM<VIZ^oJ50&!ITt;K=oum1H2fW;AY}0}PYk?jEL{#f*k4AB0m>MJ7DcIm9lilMg
zvoreX&u)B{&IR3arjc45@GNMrfimydpw{y@2G-b>ZnjGyjZyi)G7QQccI)@;auQib
zq+`p1B-OljKJ!5<&s9a*0P0~)B)(!#E1><`&}Fx~8{I9_`*(UZjrWxnt*Q5H^SIL=
z_oQB)8&(Z;4H`e4S?eady%+eUz)ovG@Wf70+YP3vYs|UVBP4T(wg)2ey@87-1HWc5
zfL8;-4lKWUe&9~inS5{&!0Ea8uiQnS(+e5G)V%tu3jp&l{7;%G_Sj3iYi~Fi3217i
z;}qTRD|gv>qsIIA%LQcc(PULSBIyV-jLMuZLvgNc(*XUmch>Ku8McH$<ViD_LX2Mq
zKIja{Q*-7)EYK}pq=N4W(J=R>ShBzdpX_B-7*$)8ycoi+q;51s0Y5zIBih~mTc>-8
z+*Y7M#feq{G7n}&@%o(#+=yw(<VHondi8!F<>(mi0=bBn+Bl~5l<GpiYDLnyrPc<N
z2H^9Rl#^!1h=5cn^UwDNUV<nXN#}l|CaBPt{=)m9!o=dvMt?@ogfscT=dbUpc60@n
zJ!6mo@-LFk-V)5OY8`O-l*Ycw6Px$<XO~GB;*Np0J*a~L2{0RdX!lA0SUJ-;RGX7%
zrqkH`Ix(|Y_H=F@Jp7RJWbWf%&j6MLYm7*rz92F4ggqZ@aOw@1wjUJ1;yj&cbb+p{
ze9x?Lwo*6UJ<o1uB9hr+KqhwWw&@*KXl2M}mo2^rM2(C~8(b4gE`MQ5sQR9fDdn?5
zemm3Xk^7ScKpmaAtP93o5=cidGb8C}W5J(K+CfMB96bFh@V#N^zN$dYzrEjv2HuVH
zE_?ytL80}J)FW_R^c~;|95UdUPJ4Zi0*D%FUZ?Fq3xHCCf3P$X2z-3+m>KX9%L}D^
z+fg8t0?+N$fs34glJf#9mc%au9ekpaVenz<UwmKCmmakqz=6A%z+!tNm{|<KQ;_F?
z%XPN{?}K^sAD(|2Opzlg0IkNwmtmwv_L@W)#3V`(x(+NryAlYx16dC+6iTsh_hCRm
z9b3Y72k)&R0a&JQ045V;DdYfz-vgh2e-OB5TpV<PWisx4_Yc37KLA^m=bZpoAOHq1
z0iFiv;lP&<u<^|0tNNg`K!?Ae25fTJ*@gH8rw8yviHQ;LVKWP8O%)hxppqd-{T_%T
zS;`EV?F!}x1k$<f#46^ez^6C@8rTwDC}4C<Yrv=dQO1#UMG-%HWq%lM420G2vgFD;
zxCG%4$gJ8{z~UpGN{{*ODY<_Apf|htFN;nC_ox+yy<SlRVGb_~1UC%-$33JB(Jz&B
zwF1Tg+yXE$<jN0ZB))Q0|IFIC2grKhPdflBiLYRog0HnU@_=8OfM5Y%0GtH;1pN3N
zP>HXg{r;soIS9%6kHPPQ*Ws7m+V@ahyA1f*Z37kZ|H>!eX~?O->{Y=A^XOhRm@I%@
z-wWUY(Ls7ZiR`xU|1NM=_KNybm%uxrf@url{O>|`E&@y^1e9P7*&jg3_vHHP{IR$P
zg43aT@=a;HN7)280x|}O7I?2iRW<I_0D9>M2@{<@^BOca1h@=N$Ghtg-MEdk0oQE~
z-3HSQK-llsfDnHuV~7NP_!j!0gbSo#CCCi`6g^iq4titFI8_W(fC0#U2f!<He<%dJ
z^iWP8z^u&uM~$F~9AI&R3<w7rIHTC(f<*DRhzA*^LJOw9FOVE^EZnfjzRTdc5bGR3
z&JT0Wz5=5rd;%=TKLAhp{NDr5&*eY<4n)h}TQrsSJzO&Pvt1zujRs28m!4Gc=c+%N
zLb>aJ+GiDm2kn0ZL65()XIEfyN~3`NgRo!#?UjJ&j=O7tRRd7Jnirg-;Ot}uq8*@y
zep6d}gU;C?NmMRC;s*y@9@H-16CdKn17>>A1K#4mRgLV^;IkiMNs^}w@6ApF_j>Ua
z45mOa=njA@fk(aoie#|fmv?}%pwMz-d7En}e)i_5be!Y(;^SDi)$85Y-)ttV);wM-
zcR#)q?ExC`L+Jhk%<n@ezR8mZTm{DqP`!N5#sh<)#JVyA+H&wD@Yo&_+#r@i00lSt
z0G`e?c2|H|Tu>FngZg?97=qS+1?KmTm3t-l1<f1Nan4(d!043UX;}jQ899FAztGQy
z=eqh20ZsIR_rKJ~y*nUT{a#8!9)?;OhzXBh_6i@b=*~6{+Nld)!dULsbRCHZulO7*
z7^c1e7U~b7rsnlR5{%G+VDXuEZv%DaIO!hfvob&M)4xR(h@cK}H6Y?6+(lWPUw}mP
zwDanW;_0b0@U`3r@U_-<A;>Y31w`AN;3Q;l^WFUWhg$pgaeH6Z3WBuux#Kq9Zu4s8
zJAC6E>J?nx3D$bsHX<bT8W-d@z<~hQ5mkdLor{2|E(HA93%;|mJMTtt1^5KWYLLzz
zHG-F2cn|(Wtp|S+f=mhjHuQ2yKu}3Hjv-JRyc`RBxw%jaUI-*N@Qcc2;BJ#jyQs$S
z4l8*GEGiH`^>@IM0G<WNaS$a_wC5Q__TDm9wo03HX|*Yf<dwR+?B2N(?s68CdcP;R
ziunP2un>m~z@?l%0yp?;wRRhd)A{cbHuD7bwTLe~4}i)5v;eT=A^a3!2dx05<Fyfo
zpf`Ksb^e3HR(cL+<s$5bN%+`+2l~<1$lQk@7?B*`yUT|lA^bP{AjDYxK}n1tO1Pqf
zD4_yY0URZ+fCLHmBM9$`J<k{_7eAb3t*9`R_1k`z?hTaMwqFgr%04^;5)-bNkMiO`
zoGSs?Zu^RWkOzJGTRek<41y~G@d7mLsPpAuKMF~2-Gp<mXClBV_+SAz4$&MQTY571
z0~~55=Zl3ZDmYzs3xcMf)boZkw3&ka$+XkIDI2&5kprO-E}Q?BF%KaE=mvfe!z!{s
zy~~{rB4RA)O^6FzX8VBE4-2h>9`K)1eQ(AaY}nYLq%H@k<gXPDh_8*bonSWtSID1;
z9ly$bumbFWB(h5_n0a99LNsnN1YRsz0Ct7{f|?F1hBT7EniVakp#Lv|$@klMA|eS1
zXkkIn8ny&5P6xU|2y`}F0Sf)-^p7nSSb(*hsQQb3rX=*|Hey3SWSI_VXy8Iepd6&B
z-zxV5)`40+cxU%o7{p*~KteoMHVR@{KM6u@EJ(bN?gD2fhbsYFg3STE;zxtYDt3bb
zG#2VwW<jUI>Aol$e9pl?ItZSRN4kq!Ke`LX$fpeR{a5$_6sVXtqy^o6$Raq3C}e_-
zA1(+he_)Z_XiRXD2k*4V4gQ!%Klj2e4?*NRqP&jA3@Vt--Xaj;pdJ)#Z2&ldNELGV
zk=AcxFwPBu3gcM`e+(KnFqt{pqa%0?Ar~O@3Z?`u28R?sq~M9p10{G!D?^Wf(8>!%
z?ptCAqWyE!j-+)K4tTRe6BFKO2KTYHJ@vi7HM){)h{BSGK=KlT*l!W~3FuU?F=GX~
zJn_?gIUrZoL(I&e47?8jB}m2|xnSES0KJ0>(KC=$08=jMK;5K4B!Xz+U-JUrfWOTB
z(elB^Zp2Nzm%y(ABPwux;6hCL5&dt`IqhYQucbkFlBood3K~Fp1M?>|ctE+J41)mv
zQ2Xo*4mb|=V$N=G_d$ODA9xQzM(1I%=YeQLSa2w>;AX%R9RfnAXpU6g+x0iohobmQ
z2ZXiX$|Y#9gb>ewdw?(^iVtK(8W3_>c7bK!oey+1yu&c@1U#@mP6~~5hVK3}_4x;o
zyH9ICV&bn<{VzcQau6VUjHYYF74<)#0&V?0MjgBEwgB~7M^t+w^gxG3Fyn&|!Tb$Y
z{W9whnRNpg1*u^}LrriL0;fE9BFO~<Z-B@UxezYm05<JM#$^9+7(5N(+UsdAkc@Ec
z1&NY_kiiAVFDFBYwhU<O;pyE1j_Tl}UTB$03v=KN*_!}dxb1-3Uo!V0ph2M4QEzR`
zIsd&R{JH0Wclcf47!W>H1tj5}4oJCyXb&Gc(17zY1ocHO=)p()NBQP#HgMgc;<MQM
zbSR4dDeEB@>Lcc8h;huX$Qal>`L#uJVIW5$MxAgSRq+bg_xQJ28hl#&GcO~?=wPw~
z5DF~w4;__S2d2eKpf-0V;Z_yu0Pg)m__E@hK+=J?41Wfxqe>LV8H^mlPr0C)>Uw*i
zrdGg|zxMzH3Jg#ffr=j3qOtx}S{<E(Ze+!|KxFtoXr3V%b4b7xHxX|(io{0>K`kAe
zZ(<Qd;F4Mg^3Vye`CF+4tOE!EfE%#M;=Fs%Y5~$0cppeG;3qKL(v3^pUu2|}1PST(
zMet3a!3Vj^0Qy-4vC|>q`Q=NX%Lnf{AhJsL0H7#nlLs-1)SoK)S=_(@wc;T#bAKzc
z1>d&d0Ui7MhV77c|2zf4<KJp`t{L!Z1OtJp%k&`#WWUZiP`k@)jKo2^Wbg+5_l#t}
zH-4x#p$Xkzw~-Lg{RJV-=Y!P;>Kq^1ttx0<aAaDk9}YqdVp{3)Rm2&Qa&U70El<MX
z=ie(7&XWf_B1Gc?tUwWfZ3XKHtsAuI@NY80eZvq!SglTQM)faE?Y|(b%(V!6b5<%+
zU_c9QfFibPell!v9oj{OpyN=h{mW4*RNswqVB`7wHtc8ld<ZuHxzQE)TQ-6xyxSBQ
zME8X~XrB&h#eUyf!;!}2*=GO;|69gGRQ_8{4<EZhV}**3;C>IBBNtr%3e4u?Tu*`9
zOJ)WDV*X3N|8J7wXQkr=GUX+3SK@GH%~wKGWw>ZUw9+bDU{ND>z2Jgk9qK**4E=v0
zzf`yn<kzo_%7t$Rz$*v39V9j%b^}j<Xga>{1VXF<HAuhBD){chksT*!_X2dG+|3}t
zTR-M6VE!#VCjsdSXrCh&)(4#tf(xoBXqh8}#_yzv=+%B}%8|WNXhcKz)8?1UIITRO
zoIyG{-1fkycyhsDhjR86_!F3r0$W(z1>oyLy$?VJM|z*VGW$KZ)4;VcP>1C75hSrc
zjSmk^65%g_i5xgKr2R2w^fvDVSaSO~2n=~(^E3VW2Z1-@LR=3y4|To-96dp4^>2k3
z1GYr}0;NY<jvSEnAW;Z<6`DQ-g9idWWPo-Z;2S)5A$*^AUx(-fQm_ctf$Ohp;12bn
zV+7E=X=Vjn>&IUFp}G5!Kq7_^h`a*#eV|4e+R;FKp+pD7KnNCoj7gz;Bi1;w(E^=P
zfw%A<K7sZqf&&Z4KE!v9==uX7h4>OaRRdI);WI&SDhdgPL&fI@&3%AgRc511WE-3Z
z!Q+K^a6}n`Lz=hl+hNc-AP7)iq=5wu2?i*PM}P@YHVA8f_L9oMs1NZ~_!tPHzYh2i
z6n?LRsYv5EIPikn8)#qkkb;3Wh!9d1kqe0B5vD+nL+F?99rS_!4n>RR`yeO<oM|JH
z@n_e3pI<>K289)J30&MB<m7MdfSd@}22H(_p=~E<4-;{>bV2}}plACrx`XG$!P<yQ
zgU$)S$5s$(aTkEq0cKF+uUf%_M}{sw#J%7kL9Ty*SOv-$c((<ODxirN<ot^DRA|Bm
z%^VQ>b6k#KW<dUe&d?O?&hJ}*gCfMF<5$`7yIh8oE&#K(z`u%1`zZ*JDe!(~7Cs$2
zk}mK~U1(+SC=I-(;C38|=g(U0SE2ejd!a$XQ$Ttg+M>>q0*9PnW{fxwu0jO`Rqmgo
zbf}sj0RegQ2ygwuH}HWi=$297-vXQhPAE9Ff*4;0u?74!v@ZleA<%gM4-Ir7&`{;z
zH(+ZLcn^;D54*uHUo!(K2!4#>&<P0(@IVBReg{_{-Fx~6c|aEcO&0JyXl^zDoK9o?
z7oe7&6AA#B13?P#PJ0RD8U#-7x9qRgffIg2u^lPvKZX)P9l$x$S3tN9u7(3zATaWH
zYrhXo2jGy4@I3+;f0;~B;Gk$CVE=b<gpb&O0*CZ1Tx~<7intrp6hk!XzMKkeAV9E(
zSP@Y~hX@S%K9t+g)xR<aq4*GM{eYV3+5uq7a)c@1APd#<{8ke*7Dw!$L2Jlrg7^e6
z0_2(>%Y7f_BP{**Q2n9Yp~nJu){ZS{y#_Jnh!v0<pwfjO9-B7Q3_nPypDXcK1&(k%
zSg`QP#a~8fX!9Y|gdL%DgxWZClnyc)5ga%g9c1CJQU@aH1B)4tk`;V711-B(37xxx
z<naOO!0{OR9EuCH3j!?%r%Whpe>4CQPKYwWq~bpqdmZY1e$UI$V?n2WprVG8)WJRB
znRD>#uY7<o0lchn3!HELkuo7}fF5u>oEMZ%e~gV!<zjPX$WO@v2bljXxD?JU-30E2
zNG3!b!$s*I?Kr$a{pTD(F#bQ?1)M<Tg+&g4(?0k%A;|KFGys$V@YWo0ybnH#GzJS9
zJZiW>xxb<%1#l(=Yj?r-|9PXsis<L?!3S)B7p7~kr8Ew0<cU0SPZYWg=cN|ogTWd6
zxPl8bV=IRmAdx}n{NBTSa32R^9*{x4AB%vWdVnTu3_#ukgakYW(53+P{ms!n@G$k^
zvwuxnKTb=~`uIFdGkhyP|NWS7890B39|MPo267qP=ZJtJVsJ=zLMN%Uc0aO%n~w<R
z!4Hi7dpaE*tsSj)C=yVgO6Lxq*n+qBi2K72I~=V<sC*ze`V;yeVnZm_KM$3mR65#4
z=%a$Wz7W748WJM_A8|XlUO&*A@aKR|(f-OQ2z`A}Nr#Fa_y>tVcn%=(yZi?G2C=;v
z;P5&;*%2)O90C!e4a7Ggc?>Uwf0xG)dqG?G-~w_i7k?b{J|YB{P6E{e2X+XCj<9g_
zo1fJ92K#>ZJ|ob6!TSYBW&Fw|KNlF{5q@xLSK!r%)Sm<?0znS-N&h7M?_r1X8d?lu
ztKVLCKr9Fo;ODvk2SRe@h9L+dP#=S^89J*9<;7+m<-zkGVMyqn2pWfeg(8Hw)sLq=
z46#33^lu6RL4tp7qBhuL_ejA#uD@Vx1QPrcBr{JOP1i$7H%|=8+dqdJa@}9H1;23=
zv;~?5o-}-222Q@A8$wDOPD+OkVL)Z@zZ;jIJC=X2K?=BS4?m&3^BEU0@H(_#51(g2
zT?U*C4jp@ga{+wr1wW_vckK$$QGIW4;G?czwRrzhQP6e)yo|w|+*>Z%Uq0wn4uA}S
zOTUTM5gdl5T(&>YAE3gj07uPG6qgKn!QK-g@_unMc%=WFY6tNAo9ee6odY(9p%g;g
z0h&xfzp~3745@wv{0IRERmqX^`*&v?(&YaU>W%~kQKWE%2u&ssSoLpSfCi1wfwgbo
z2HO!x!fpP+%Hw@>2S|r-*H38Wvp?g$>2fd~`HwarB-uX(+6ZsLhiZRhH#l`eH;0bF
z|HjxuvkrtF|3yoHa4*F2(64_Zei2EBsI$N5k04v1v(w-L|LBh(8{o@Wcpre@k)ZvL
z9sdiTAix$8gd?~6l`KF!J@`NiaeKA%;9=|kzrYVR^!DIc8)zX&iXeR2m}!0>RS=R3
zVgtzHBT4`Y%g=Tm>U4feY`9+_VF2PCzt#7%)bI^<1K`N?VIh7+5iz6!GUZ@Ib!e~z
z-&}{w{X=N~|K_Dw(KlLondjh8;dhy!ukmlS{EJlh{c=YV;>TV2|It4lc=a#vd+*`?
z=6=|ZHuksK_v2;=`1sj$=$}izp99$iVJ4z)g^uYT>Ddtt$f21lbRWdN1;kW;G^!EW
z-uZzoe^EzYz<(-uL|*@w{6sw7pCIoakb<}c<O@VS{a0!~)WiJAl;=l>l?a4InDWDI
zM{{m}aeu`fL=xx%L~Z}>`rkwdiiXOQKb1%`c&hjRwljY7a7TUir_27i5AkpH^!r}r
z-=p_WOQ0TWze91~5ReVOO@ut~U$*`4SB5zkOn3?ZrA+b-@UIYEP5x+`zK3iJ|BHqS
z{lxIUJO%vKqdJoR#h3PBA{#X#6AB9IC|cVOEnIf&g<CL}7ee>v+veP7zEtj{SB{P)
z7NZSrE#2N99ookfW(pcq7Y*8Jv2djn$-R>AKj1hUx1U~OopOPAakD#nPRM>=sB$A6
zzhcE=;}cHv0I9{^wEMQ&e#3m>4FeR{MZGo`?XFuVT^D;EuG4+;y}oMDb=ElkNrzG%
z4{`lB>&hicBR1h!WHk59&h8Cunw%?1NgYZqf~bw^oCP8~CY3D>7uth7Cf+|#lh6rU
zUc`yf(R{O4|ExG>*gF_q5r4a`zgxrlqg}boJYERXClqG-vsiJZq8y1iqAjISNmwlM
z**kOdi;F7CPC+3Z`w}9HbKA7e<fDq^j^93ijc93p`nFXA&5pX6Q~yGgDU(skfYV$>
z)r`}YMy1bVlyft(+cxjR4K;3byq|ZN_wOKOLdUdzaWP<L@<dy!6YD36<6lKgwDOtx
zab9h*m2xB!xL24wE-W8m{Ptn%Is3}Qhdg~7?p{o4&$<QQ@HgDjgoaV1NMA+PDLzzP
z<x)In#DJr^BdH<0+)KJKBiMW!+vBs)^u?VjmjY4M5ORMR0UNZnITh*oj8n(;(pu)C
zrHF$>?e)5=+J(L*51{wM>a!La$J*lUH;b90v>Th+=a!Rm44F_aF^?9FJ<)Q--L91_
zGM<>mHjS3x@yoPHi4OU^I?5>Qi(1<t9O^&7-rqqeA>MT_Z0<HO6H0;T1n)<uAj04Z
zBWHX$x0G}{mXypV3Qso8<LLMzO>Y{eu#ig_HO}W+wiOvBk#gvE7%ksvVnSg)`HDk2
zGUS2<u5aVZw^T4~&EXxxmJ7YQVY%G)ks)`eSb09~;^Fk#m6d0n?qM+~-4-@sZQtuT
zXX&x~@-f%Ps~5pvYo6bZ*>`bXm&c}BNOQwcvzrcH)7RoKQXBQm4JywTa>QVxgSqX7
z^5%{wC`>dqxA&V#>aOUmtgt5HKD|Kf*+?d;TtPo$X~dQ>Jd5iZoz0%3g@;Y>3aKS`
zykM>RmCsuBTc7b`wo_$7@plNUd-fC<-hJy+?@8#G&y2tH8kxJ%k}-Z@+^E5|IshgY
zxGWtW&rrPbG>I-m*@pKicDV;}o-<)UAj5`s`N#;l@Fb>c+Ve~GC-Ej4ALL3UNcS#M
zonztYu#%wfkW^a~W9)q+s-`m)rKgD`8>$qnlBe%u=Gswjw%%;YXSTw%h5n@4D7WH0
zT~rwfS)4L&j%dR1;w|H3o5~)k9-dW$SLjNr`9$Bmo+q{tX85~g(%uN3TgR^dXqH0k
zsE$VQYTHt%Hc?UkH0R{|NX>Xp4q6V;j*pWQYkvM19Rw;VC%p8Ms~##>T%Sjhl#tf#
zUtWA_MVQ*Ht1hWF!BM8lALjjWEc|mHsfICUySUDnDQ(g)z40geI1D2;mMb-P!!4@T
zQErhLl3iXYW4Xd-XfszV=Ep*Q9j}N%4mqKBgWRaa7nPV(&Ponb5vRqgqMppWO}pLh
z918A5^@qdxYA!2WuNO4$l2g2Te*XB|$O|}(#Qro>uU+)I!6NUSk@|`k2g_$D)o*(F
zwq2gj{FxCdEQB@|PZbCEVursFL-U+nKlLNuVd}4SgX}0eD~VDL$6PsaJU)t@pl>pI
zh(~uXyII!QbB(+!dG7tNqp_#Q<m8Cl@eeI*%(J5DbsU6%{|Xg+>c08YR7+5;0NbEl
zi53!}cl(%AXfQfChPJ&J+C7+16fII1Fe0BZBw=f9G|G^LDQEN*hBgyjv)+0RV|m(h
zF_%}*?uxj_B|q1dl}jG<T&6p3U0}n}b{+}dcm3jKN2aL01&7go9v&y8`YM=#$7kM_
z?|-4=EG6v<YRg6S<l*8>*HjO&zCx<}CO*~o4>*bBXce%68T=HuJs3N%m36Mqo8!=M
zzjsim5v6!7^oCpC6#p7!a=7r~jAfw_w=DlBlxhVZ*-d{@isQ^gg)t)uHy1{X)+5`w
z%)<0;#0QKt=cd|~M2bp?WwvzGG3k=2PMX_X6PQEKy6$%cSzcWr3iT%1djZw?6|vyK
z+Mse?ASL`Y`O&!vDGZ}J92~Z0gl}MTNZZGylJM2*o0{-V$UI?A<oue3J~5nQWTPVL
zbII5$pfFii(l(A1b<#+7K_!?>**qx3Dm=~zYX;MG`E<zRNPivvP?3{nj-pQzyc;u@
zdzH!O3S(2TaN;Yp6r!@(>*+Syxs*?}U(Az33PC3B;CxSNxzzI_BK^50c0R_9=&q&4
zhn9jbxEzRNK1`iDj@)o}h>W<~gj1YgWyt}btjm0*ZmP(E5Lbn;7wsX6PTxZ&;s)pR
zHG=rv2Hegy16iq+)!p#&{^SJ9J-(5y0kdzOUGqi^+}hcnLnFK|(7x8+kt|Ub;wPbx
zx03H~aR2(TT<Q~{(@D=ri>7i(3C!o3XlGHp@~1osu%b`&Vm{|;4qhw#c<ClKj<#(1
zTJ?a0bzXs}OLN63Qlt}?3|TqeuZ1yvn!90ag_Uu>?AA24D!y%WL4YSLwQ;hQo{>`6
zQ1JN(1`Y$h072EuZ}%)PhJ&b*(5{fVF&LD!`HZ&8qn)iWblSgqE=aWb(iY0_c%O?o
z@1~{4RojwXYbx%W*%eWg+*pw%T^mTazN`t!7mbqH(rIq!6MIGxoJA*5vO#`VC!_It
zM~YHBz%R`FIi5UsmyM0Iv%~QoXH}DUVq(uxx*6O|1`W~e_yo(=MpmG@>f4miwseba
zE}`e+Y>^_<%Nldz*-?kwdgR5xkEd#bmROJ_T}ICrR4+UKfz)3VHL+hM80jS}TP#=+
zb|T>pM`Ar^hk!<k<}*Aa5*zM%)_M;9a$8=!1;HVE3V&lyzi(WL=7l8X#h+D&H`&St
z9f6$rnCF5$YJd0TITkipJyZ3Iy2<Kq-sR-agBYzsgBklMX(&QY(u5kF<I?>0A#IF-
zgP+hv*)`{uy-HxKd@a%zN;K~l3g%?6T}_6J7EV0><>Fk4q+JF1hV#QjD4e<c3yV0z
zK91ZXM$wA|u*wh-q$zQk$GyElZsg|Eg_nAK>2JX_<OwJU&}~CR7DlwT%|e)0g#Ap`
z{lvF%aDDxalILLBK?Tn^C+$C>JVZH>v+W=;ZdVdK;uD-$k=`(iIvY+?-Ch?D3ts$8
zLwA-f$nRKK0d^V=UVXYNyPxWC@z_;7^H;#1gJWkaA{nR-^GLqi!(twJC%KXAOb=1c
zkaoZJ3Y|>7lFb$-6OshlDTDQ`V`CWJ7$p-^>!<`S>a`9lsHP6Ab%MSZh&eg5v}U}T
zJaQ(nZ6vpsz65ILNt@(HHAZgC;HBD>uGG=Xol6`rHENjk8_h}9ArwRJTRayMjHDdp
zNAIJD<6-B*z=WQM^W4j`HkC((%ZVy`Dec6420v4LT;ChLi-94*qLug>;i#VysqK*!
zvpZ2R&359|)p5er<|R4qw|B6zw9;PlG32PeJ`|}h*-}j&L?%ia!amZDZp7SNJNI7u
z8D3^^2YWGtahtu41#A22lUvv;&Yima)}K(Gq3}$SEMwWJ38IiF=S!7Y*^Lv;nKD;-
z-O$IOKCM3~Lly2^gw0;LMRDT{cd3o0%zL@EaO6n(b0}ZK1u=F*OKqZ&44D!+=diiu
zhAQ~bf<)2jg@uv1FZazTps&mi0)!L$VZO{Y_kAF2xS7yh89OH@QFD?sLvh1Ve={nK
zm=gnr6F3nVPtD;YuSBVUOO?d0kwU|F6D@ZBgS@r{Arfw9I!P$0$YNU8l357-le)GF
z0j9(P>-uk=R||xk-&l)qV>uW};>PnU>uk_{#es3RUoFOQGudA6DP6BadYj0;a6)gU
zmK`&^gu0+g{iW&)n{0G(dYDx6sm-du&gxI*&b(da65WZ*1wCxoS0fY*Lt+!A772tp
z!meYIp6Nl#d6kG-e+hT1tb5JwB^DKJQzApFyrjey$~B*g`_0--@oN5euu?;XZgE*O
z=bqT6c5EK3Amhu$is9+HC@Hl=PbnH6uYNOCrnjgF%cI~}o4vZXWg!y^XM+TmcS-jr
z)H0YhlD6+`arrEXXNrWD&5jaPD|sL4y)wJrOmBIk28Q+yJ~Q<@IxeI1^$Sz>VVIV0
zqnyf488-*^^^pe|#g`Fcx_T=3C>dW*95C1=IxR<8mtg1O!gVXyKgBrrz4f%#Sus|;
zJ53H#wQ1{s;KgGmQa#4V{&8o8fq^7~LGMvM>L-`}6>90PNKYwEm>H5%@iTK6?+FCm
zuOJh4uf)nB3$=D?=H|XFfDxrf{V=cG)yj!5plbr1;nW^gxywr|8>gW;DbYv1Ja;$G
z<l8$6`If_MWcRAf2?N}nB<NB6n8n4g!dQ`Sr%vKgjcu|~d+ycQNHN_+exiJtlh$#E
z{E=6XwsWMjYN`j%-K5F(cv!Mr{~+LE)X$>t^)vxer+(J>p(sO55!;3rZ>#IATvqT)
z-()?NnxG&Ro)?&7jI>VQbQq1T#%~K)E-7bk#1GBHwldt%&#)2fZEBW7bH*XTGDS6u
zHqyQY3tV^FNn^1T0Q|PthZo8`u$H5z#hoLSe@B;{F>Eg(K^`rIoWhXL@l!hWaHpcG
zsXAI*?^N)KU?b)_hfOJ!fc>qlH~|}#dC<OVo(3hAo0Lm@RZji@4EF}JB@WyWx7?w!
zqgbg^Y!eQDB7fgyYmtBs&w#U#WM#g6>?PJ!NqcvoT?_3kV7xxk9`N>)Xvgf;ncCS|
zAaQ$()HyzOU{9iCoMs|+^)aB@njEQ0W2pP;9eo#<>l4bRO13H;7X`WP$k-)--2?@5
zNuo%j>c&`Yg;iPQb=OtnNeOTj9V)DRr#v1Zk#_Pe>xiI7nV9L^H6gyy=O63z68&l7
zD*AaZH?f{IBC<7e7Nyj-xks=UjbzMYzWBQXBxxV3Y5WGMd3lXo+f6XbsbNSsip|JW
z+CpzLOs*%gbL93dPSH`EJt-xaaw3kx^LQ*DvZ@4bcl=8{JNa5k9&4vp9rqb1sJBtx
zqqUM74sPip-8IP`dMqeGh|7%?Bx*$_S3^p}5d-+jim)cW^brGxX%1(;24+OV(6MT&
z>U0-N3W=*e=QuPa7IqwJ1bih<9X~hYAo=|DtGI*!4Dp0Js$+Um@!t1`hRJ8-C*w~D
zP|IL;C5{ONM|iwjs;=?6=#rwUJ+7B2abG&lfh4re&|cYr)zUn`AXPbA73ZU)I(GhG
zV1X#r3aqb~aIHNp_69Z!H4_SBcmYZojhwSG_kw<(W?zke>uSTM6)KF5(TC%?LP0`+
z=JYM_SjS5dC0=f{EhH1(t!L~jsLSMwoT3fXmRnbOC+-DT5j3<@MP8bTk7}NMMa-^K
zE3)#Y7yG!l^cYfg?)A&{?oMtv9ElwM4Y<ByzBw;%Iy>-}!H|eMa?5fPbu>eY;<|KG
zi`sy)i3dQ>HK@f@FmXd%gsl`SV<XCHmJAlZ+s7%Y@<9L}Q_i9IO2{aO4e)z;j?Qv*
z(+stO#@W>>@*q*QgfGu}FDM&CVCIWopCNXL(2svYzk(e%kRoGikXd*CH2qnr`9Tfm
z&4Q}CW2db=9R1}dBL+$={ZzFDV{TyAQuWd%<S@@>$uV}JEH<or6J*|Lo-Ka=Ny0l{
z%$N1#Me(s=a$-*(w7YFN;)BGzkqoD1CAM`v67hl7h1&=(!-G068u<k~YpPgT92Y~l
zWdba|z<(;JLe#~kmIIkz35}Bzx4o`L!e+}-;$^qK2|(p~H(v>Texedw^+}XLctr-a
zZQ&&*(EY|=@B3ta>UcwD9sj)qn6^mIK(l3eP#hC_`Nwh+T(IFLB&%{|XEbk!r)Hy<
zzbb$<+jVivwYbND&$72?rhNkoy<mhprJJkAiM&}Mn4YmlH_Y_zn^(MSi6mq@SiyG#
z&TC`o@DGnTNHwcstIyb`p?lFit3|FS;zwx+=+`uk(ZrUNI$7^bRa)kHx-aWdsmF5d
zrXI4SRy=7hvR2t$^RqCiqLB}1W2l+ozNjsptrI5Ct1QLdh8}D0Qf&5Yh<)R4KIxzU
z04bSalUcG+`Ns)OX^teziJFkQ{+d{SRAQ$sU7st#eiY_GMM3e!Jke#Aehlq&MnNQ%
ztJtyCOC6j#{1Svl1T0BLafOz8o%MyiChzagu%d{tCt}sQtOOczM(UI3aZ0N6@Lgv|
z5elX&Bej^E(}dyle~Pc8=*-1hL1##6$YoBLCZx*rk8_}L=DFIC?qbq7mwb5|1q)L`
z+9sL~P=8|;1)`$OzIGv_es3I8RO6G%x=~Vt$o-poXc$nd<Bc1ZJ5eI6LNaq?Sb=6A
zYYN$ofx_=Zij?y)AZ1?YOJIbY6_>!Z#$~6!Cm<X_lGkE_lWK?5Zc{T^YSsFPA!%vs
z3yvC|TcToLIk^qSR&n_!^bp$+2g&-j1OY2NYW8cbDrkQ1WnuZ(pR^N3shWA{Ua5OS
z5&7n$SWjWgu=4A1O(0Dgl>>VpzP#Mf7SSe;rgTHH{`v|GJ2=kF*UW<NIWReh@Mhph
zRFzI@u*&o`MZ#^gk7<UHdUAS4kzMAis;@EZj#rdN3mO~qM`sMwI8k%*$;Yu6r1)Ak
z7!DPM0-#{#FA9>}TETvbeMgK8$sr)Jw*IsknWqN+6A7}*E^m-gk*GZ>3W#wpe&fPa
zW93k9C=eyQ(3$92?N=Rw%Cbs&Gq?*qARJY&R*X^ukXN<R<B{qK3^fn#>9TTg^)(gw
zo2?ayM+D`IIWu5|<-xdDP~v($7zNH=V!W3^Odc8>(ZNqNOqSWdq=&_N&uB}Cs_`5l
zfiWz;KOxT<`0L13Jbs;-)Jeq6o{?wl(G;;yAngV>wR<HUk8(ES{Dyv>%bY2rdtiGM
z2NtigV9k^WR8&cDRe^jTj%7c8sotwkRi#!PFgnvd?e@KZkT8$lw*euAGGbVL{6(F*
z%C^WPgB2~luNRgRF=vsEzb*AyL8nG8u#;eOdnaqrN0m6Tv-yeQCK|RL<uO;FgOWeq
zwRXvTBZ1`dgNZD3C*-d~AF8om!2}Gausyz(HJisUii`2>kK9xs%%BMu+>>pPQG9{9
zq(i}@)Qqh@xV(tMH$=+Xo+J?&B31oZUO?)4NZ(8B;w|ZUJel(p<r))q`b7bAn_n_u
z+H5+Q)cDdi1ZQa`tO39@D=yMQla6$G_rcP~u3VU#SnB3_1)l`r*tC?OB;o94ShEJ&
z7HKATM#8Ml`-{$20zpVdF0w*Cb=R9E1--p`Wf;A3d+~C}lNvbZCwlfM1HwC<=fniG
z2#uIooWKzyJzto@Rp*LTzAbe20z(=+mb{*coUPCc7d$#qFGS$WO~|tjE)L=+kr?Gh
z8+&@mg$PO+dv^52&MRYcZ=18`T(?zkZd1g@N)9pc%qf3xd*xy)6(*mWtdHjO2R0)D
zZefy_I&ATpnUh~EyXF~^q;m&xRk*guGOb4g$i3Ih-ZNEw^Aigsvhq;qj1_#oOw5V%
zE*f|S$4f|=CUVH-fz1`vV@Rn3VaQ>eXEx$7jb73xNE3PZi3dh?x^C-Q5K>#?q1CF3
zh9^z=O-r%ZX$a4lP@PZIlc0A~>y<yQ)LEfd062w=%nrqrh$)@g9*uEG>RcCdMt<t`
zSxz%adagB|ke7C-iSq#f^n?~w?A&_c#F|;X=5sEbQGw~fvoIBwt_AuFCL-Hj9|tqh
zdlyEHJ<Sr0InjM!gv*_Yocc{sP8&^z*D)AF0{go}S*~3c&lyU{s2~?7ZQY%AGI~lc
zGl#88<r-LLL&ioHCc$enVn^H|%C3!RJVw-q@1~2lTyR2^$;P~|jU$O;#a}EOJyB=~
zJ^$D%kBhp>HmVY~X|ORIm^Q9!+t#+F8Tng@i~*)xJvTsx-t?L0BgZ+duUC_N>Z+Iu
z^_X{`Lak=|#Ytk}C`_EOusFP?0P!+gTA<j)jZB75g^OH}UHe!q&WXe5afZ4;w4A@y
z9NA<(GYy@m`obsO3PM{y)qIwc+pO(pu{tBggbOeVMAd9fnYgjozAl`Y5;LL7kc*mW
zeA`D!Qg`Wwem>t>RtofBYMMmGQo|;rQTvQarQpYS)e4f%6{m`lu$nnT9Ar_6J!wkz
zbDwaw<lv7uhIF%SGdVeuZCSW(rbpE<5n5-Dp;bAK#sJ~xe$@E{KsBC*()LI}7ExA8
zBlcCGx{+{ziQ*PTO`2H@Q?f<y^OAr<S{rt8QI)6(rm%2Bq+3-p)5YZjPsPffgrU#I
zUNZLK?8;@wvl1}wzz`+1EG#SQ%h+5L9jfTbMCVxyD=1#?ch#@C*Xl}2;6doy3Ul)I
z{FLizpu0xA`M5>PUrYl3A#SEOi`lLdCWjG+4MC+)t#G$c<r`|4cD&xam@F_b6Af(C
zQeb-bHr;Hv&|VmA(x_H!%PWQw6RYn7_9HLvH62A#4j;=`V}2CxzSWTjAx(xYI{ElB
z<x{VN&oj;qjLKLdZ&T&Rxg^j6f1O=}L%@L>HLA5oY<n<qP#}@t;KDEttQohL3OhrV
zHzU-+51-9bO&$9MEvYKDK6;J%q$c(Y<DS*~G&rz)p>pbVlyqiYyiLv^lQ#B;pB432
zn4fN&Oz&UbTWqOR7%|x;b7#kl*Ahq>4y8PoXrbyiEU1eAF%nJtU3tk~-J=uMC^6@G
zcxvzBf0bd*Ri@k6*h0n^ILi${%<{Y%8h>e~7?X+MDSpk%F$q{K)?_f{TMZW|m}lDA
zQ@z8A`x!K8cg;GYt8!e@r)mA8-@2SK28}<ilxpW8sNIzwuTpZSpo%+Nl?sKtcj0kk
z<Qcs+9g0H3EibS8=krJJpI}?wK8b3$#dhzRo^pHcg01Yu-m{@$k~|)FY+|(5M(v1^
z38*6cH87jBwtb3{u~OZ;$q5NC@1Aig5&HOAwz+(5!N&3$mn<V1tzlF7eTIp~rHIgk
zFaBZoP2;fvQPtvgqg}FX_nk#PiOG{{hu7sJHf-fsvb=pWJ)t!G`!(W08&T*$V;-3h
zptJ03lq02cTOzdgn@|G?2Zr&sXa-tkU;V9o4J`$yyYH4-zc=<=mS(lwyA@nchgrqt
zWouEK7d#9>{^P=A@~E*{dZp8k0ye`a3Jgi!N8iwAu~Xh?pQCo4#rcebqU$YIS(sw6
zd8ff7LjtCK{X3I;Tt+7#I8~uRJ$j|NC~Wi0S+i$NOh%0l%7%vC8iY^0C3uSh+_jve
zg`bD`K7+h(g^Dl*E%g9ij%<Ez(4E9F+c6-^jHtM={Rr?ZS35Co4fRoyYM}X@sVA~I
z-By#1UoJs+7DJ?!yn!sY$CQJ*S4L0noGwxlmX)Q4D;{oVtfaE+nw<;3A=4-@qRNdL
zL)!IXX3L;|Ns1v_=ISxFR_N=kn$IT6YUv_i?5W2xQItl~^RDa@%6pCNSE!L<rc`EE
zrm(wu><TwNr);8I0sNlnZ55at6Ykvpx?IJ+eVN$PWBH`#V+xq|h*WQ=qc7@A%H?gp
z>5`AtpX$s*qm*S8&}WR9us;^-5r*=7lt2CydrElJKCTUjAggyt`%{y~ds|#=C?eY=
zo(9!6=F_&6`3^*w)Y-Sp#Rvnur~FV&k4=X0WH-b_y<u=GBQVaFQB>iTV*$D`=23hT
z;;U0Vgt)|>13Fy{6Bs72XEv;v(yZ-b%BE_tUj9nAu|yzAjm}A@*Cjoxw0ATy?zj^c
ze@^~*3XPXuwD`HG5SL6$)+LS@%ibrC&%~XB&0#;K^hW(m)9chTsES#{8`FC2q~}2X
z*vziC$c|pfo?S@#b^R<p_gafPw#c`PVEG;4&8Q8RxdjHr&6$1s(O^jh#4o_?td7Wz
zFKI`=+}iul`C+R61R!P%2?<<rN03OhnXsM@o;hjKAI4CxO_xC2EI^fCQB^JR#P^{E
zX22zyTt4@kKKT4!8fII$-E^nOx|mp0oadEAsQiP-Fcx4Q=5=%Jc$Ncwv1rP-a{Pv`
z7FhIho+!#DX=Lwvh}8G-PAAHVH`JF|Ii|O}P<H$7p;GDLPB}22$RnGkX(eaukF7?t
zpzfeyi+e8<kvo?}+VR}T35QxxQqE%*Sp{#%iVFaE4`hCvYaV({DA&;#!_$0QiiK(?
zr8RnGr_m|Uw$Efq5;_(W)%AAdCIAEEEz(e6{GJtgg05rgK`l;9LI96aL_@y+q)~_t
zOExv>bTAvr!|7bcd7W`>mc=yO$pE0AEnG!6*pk3!m6V$MkV3XaT8Dcl;iG?a0DobG
z%W=LwX&U#GJL3U<QYLyhEuDjwQ2uI<$6vQvQnrZD)aDf1PGSI=#sTA4^_+t;owJFj
zr;~{>vc}bWXA7!ACN+cYM9_7tLRQg8PhK<1UGw``eM}D~PRPniqm=r7bm_*p-QCVY
z@{CtT_NEr8^O$<_X#A^*!J<7p+?*|b$+#!tXQim`7P<Q|<hU29bO!^2d<{{Jtu^s6
zQ&{|CzioY{ta;sXHMG){Z8y3BAxu(LG+kXcoxJKSKLwvze|A&zn2<O}K4841rOdtI
z;EEd(q%Bd0yw(v`<ZfBWXZYe3)?jRPK;1*??A$i_TF0u*%Hq92JSR-dm*{x%gf_TC
zR>uI@C75Px<=w1-J!93#E030yn`>FXXvINgkNh<xPMJu7>YG=STcFC)m*mFDZop?4
z$B?CP3KQop(H5^T<V<T%>dB9i<zY9lqDv3<175`HMA6;0IEG21d)20L_al*cGg~wF
z3#^wi>vK^B0fj?JcL3ZOKS^P(W2a+5csZ&!ec<kZtJS%Tb^ut%={rsAJ^cL1v^BEI
z+Ut~gEj>IYwL+Ae%^!8T+M(i{4`IllU!FAvphhsB1lakx`u=XttD-Z>8U>oi$5e-r
zPTnQeD@r0Mb}_Rk#xlr6pP()b<dMu}3(Xs^(Dr<LOfMRy<PrB$yzdoTaPXCgj$krg
zmmFl*cFt!d07a+P+A`KNV4S%pEcnqtwc&2NaFw{ItVbc|Sh2-h&lMCI)D)7Z*oxRD
zXy3dt^YvI&312q4!1C*`78SY{Oh_8<-Ipr>%9%W<C)w7X+2kx+7M3I>;|Z)jo=d`W
zV!?r}fUXw9`Z@#*HiJZG$u6MW(Xr79{k9QUOCH3BYUD0ku0+^eVYlk_m@1v&mG|Qp
z?`=E!sa~ODETeZOvU*D!dm3jA6&rEvwaH`KOoECm!<kjaJWZUmowUdG{=H$c?uFT=
ziYu*`N<xUqS;KHJ$gA%AB$RMQ^^$#iJIjR9?>y&5xm%+@jprv|Ky2*Ez+u}rBd${Z
zTHi-pe`Z&iSe_(E^hCk{e~K%BFVobKg*x8V5B%4}c-j}uhX5lbfvwyp!A!bu<|-E=
zo^Zr$Xz%LC4XvP@z*VFq@8QT+pyGL9*N-0JUfU3FtVr25OeS-+!O_Z(p%qn*<{Wkk
z<@pc7$1OUmC1h(VG(>2DW;(%FRbA5H*eepnstS+BfWYd&8-6S$dP_k<STH(axnkC9
zOz2<T_Y?O>R->>lN92a;AlFs%9h2b2->#hk;EjSTsplRC11B3HRfBxCNi9zr0hRGX
zTzrLWJC9MhA+q~x^uq+006v>K_W*kj$OHsB9an*q7C;Njhmz6>I&s`?67RG-nVeZ^
zf|lPirc@8QsJBtw0nMpA+GO_Xq8w%aUvt;~&UF9A$tf&Sb8O1tQB#XXIfmqrN9FiD
z5;2VAL0V*FOcpYS;VE%-P@bZmgi#@fIW~LdRLNn+!YGG1W-J@u_dMT!;QQNmKkeG}
zxpuwZ_xrx@_kF+a*Y$ZJA6`rR5|Xd*!iRdK%n*u6$OfW8AJ#1Oa{g|=p8uCp2Z1Vk
zCy>@~CB(uh&OzQq+=$7Y(W(3aRV~mlyZ)VlNf=58#dW^%0DfBiGsGM&3IE5!B2t3G
zmA~xuN-p|@I3API^8?c|QT}OMbEZY=5$MrGLdBOw#J^3bg758`$3FHh=gUqYR4<V7
zM+Og@b<3U$<PlF!X-HmU$v>&k^GEM{XZ(Wx9tmy%CiI0GNv{B`?Yp;Z>3+|<jDaL_
zpnpM2-)szCeILBo(BO8owkkEI(nlV3T=|-^s#wrNmvPOXPe6?s4JHhRqH%}0t}t|d
zQ4N=GL)fVzz*USs&4Fbsv_F<3URjaRScioGci8Q6DTr3BI49GQi+O6&om)q+6AQK5
z5Ra~zB?M2^yl6d03>lr;*`J+d{vDugaAJT64YOe)dqld}n=Vt4Uy7O&8%Miswf|h;
zo&4EW_1dI!p6AhCMP@>IlU=NHO-O?W|FxZFw&9qg0?qyYCI0FvzMf536&UWnu_JPN
z8Y|fI>8IxPH7FNiHzzUF1RLtiH-x&v{5x_#Duh>JpT$R~iCxMnf@b(a7`~`SJ52n~
z5tURGtugu2gNtTYBT|Xq<CN>+GNN@>2i1%k$KFG&HV&5O_ua87jqA8}tQpBNSHcj$
ziyQ1C(fdw0r6q)``qK4Nfuls46HRvLDIx7sqZXewo1)$P&weP7k5&1j5A&yFO?FdH
zzh&$1wk&!YSPxS|$ai4`-<_cEIrqo2L>Fq$?~J^Z6M^~dN6*gJtoiY^E#)daEvk8L
z=ET<HA=Hw{6fGe2Dq(u6j+|U;gyV_6I<v-B+zSiAu<rV4BH(r(k~^}?H6B=F$Ngsq
z`hS#Qn>g_ChX4ckUd`GU6DrUz6^{5{T%ek!q)Umz8dVXxVafoA$6!wxWh@a2vVQF<
zF+yRd^ABjJ;pS*@`SI|bIXPL?&JG(%Zxq3F-xXf8A;A|O-03Dnt5fQ8F)Q+#|BUrY
ze7W>R1CPJyjuFKbPoS|6Yo64i_-!SOTw-c#u=pV@yNoSFtArxPsG>l#s;${Y_awnI
zC6%+Qgm6-%YHihc6vj%h;YWXN0A);3jl18XpBsG_8d9;;>WkwzH{QCp`}6K}X~(&m
z*0C^h;oI3!|IC(~U;4}R-e@sqknRe0u5(GrMVyfivy^lmiM09WB<u~MK>n&M{b!Lx
zWkGc79_3Rci`a$93#e9^;kAf^AW=+-)p>2S#|E|z<|4ljuY?!Q)>ZqfO{gh%C8OWm
zW5axearUTal4_zNU(!gB8TO>>x{B|Y)8R_cUF&8Eggo4Y;~qK`HQ($a-rrOpw91ve
zyJjV`$SHnu0efvf;8I><KjK;8`d}=ENhA2S{mpPgMjd^x+T#~HY3>9fQ)8WJ*ZI#k
z6s5%!eW8{7tUYFMO%3|ok6Yx<u(_KaAH~1_+6m0$pjaa1(pJP^bjH|^zN(%Hf9g=C
zbj%i7AI%IHX|j&H4kzo|$fSolz(^FYk#yi*&~}x%KCtBo+(_2YfWeejkgo2sF=aJ8
z5Y6#4sPYBvS6JcBVavY!mv;;kA$z<H-r-?AKIwTa0SoMZbBvG3K&r6U`FiNnIJZ{3
zDR7}~P2;HjwayxDmw2hyx+xTE#&Q1q=7h}G8S?WAj=#{CT%l+3BPQ(G+DAsy3)i7}
z2+JBpgpS>Zo5b12Pcc^Yo22ykVK3sT?x-}ohf<dk9rKu3-=0*m$F-W^EqMgj+ooA#
zKfshtOJUBk&I&|`5H70btH@(|muyH%GOuQ{TeNr|FjRdasQQZFh{!-1n67$lTwgg>
zNA>GxHJ*>Q1~1SK5)}S9oEN!JyAc_fH=)%_RrYF&1we8nOY}6q*6Nl8INWdvZK<<c
z6+`vwY0huUnd-F<a+4Z@*Ugmrcfqu)>M5Jf3&2HJ`tMWBaC~AH#9N&hGp4P7gK66%
z-00rs9m%(E%R5QZAbAI2er5~B9n}U_lJuW9ETRs143<2OZ$wjMKuf;TTgk3nnJDr!
zaPZDy`|Clf1G5jHt*(?ukA>owcZHd9u7;*(JQquju7A-w|0Utf4#W4)D*&Xr0J>zb
z$8O17zfRVeSl};A&nFd<?|N#U^n`6Tb%%G6nk(Jd0U=TR>}t4P4z_e_;b#T%t4f?b
z^%aZT<-?|$fB`B%jFvaX*s0KW`XIXC#5>&B0UN@_jM|fdG*3t&gJ0D{ir9?fd!sgI
zjy6KdgzBE-8iR`2yXAREw?QsW|Cggz<(-*>;%&B@X1Js5>V8zo{DYRq!nKJb&I<vE
zPaf=-xIb*~Kd1v&lGU(s4*BqC4rSC+s7{&usSz(^PHuFq7Mezw_X-Ip>Q>He-2Pk#
zTCRE0I;V5ka=;RL`eIDwK&J2UKBgVijx3vZ5TWL2!MNYNK9{1$L-xbjthL8=R)I8;
z$!PwGjAZw1<x3^byCvXgzYVMG$4#^R3S&UtQeT<qsplq-_1qu;w3k15GBI<n9fWc=
zagS@Vu*$!ee)Ca6IYY^nqU{ZBXj=Ui(;bjEwg)<Nco~h*sCj(g^0+P!=|SN(=y#$@
z<2bZvQD7=;s-sXuw9MMW8237$F;i3;$$ctB_`)u8Ja+dPKgHb?kb=pt1FB#N<l=u#
zEvZzrbjYwKiYgw)L+%ey4WT$^$PT#cP30tObL?9(V=bO_h)9f$`E0BT{{8o6xgUVb
z2noT^bL%1?9i#;d?15U7PXTilk^Dy4>mI+c)fWWE<QA*K3*${~K;nZq<ne`MMuh6G
z96$offYw^Xnstzd%ay)5CaiZOvu5>#3Zd!}A)#lJC#NtQ3E|4wGS!_i^+SGf4>n|_
z2Q7zFOIAQhMjX!~NU&c97gBFbXX~J+*I$=yF&d6yYnXO<%rdsCmR{m;b;-QiHZiw!
zo~rS?U}_34aL8jygrNs7Z!VW_&H#F6Ut@Ge1}v_pl(H{tm%J)Z_dvaumqJy45quue
zdhgrptkv!`JDYg`!@t_ARUK3jM8hwp;`t!T7zsLSa@&HYSoJW7GiCPvwZsO|ea`d@
zOz+ypTaM)sqsLsI;JaTMZB2~T7m^MD01OCwK6~D7(j>uM%tVyBPQ=mFV<)lri1luJ
zdT#1IDQxz(T|KsbYy!hAk}Otk0WO5@oJ>3gm(johSC4JWNMq1P1N0p3-bE!l{}5Jj
z%q$(Ho_DZR)AO8JaR<C8UKEl;hREUjUoRXAQ9dJ7Wo7!LG)Pff%M#gdCo=cWA)UiF
zbriK&TZ42V@prg!;Nz$ZkT4a0)-K#eg<HdN9VL~o_)5t`9=0;M-)}Vz_^Ibh1}oR*
zeW&ugk<g}?GqJIPLu=#%{9fn!I>CvQaskbF@f<Z`J|H5LGS@<#?LlsgZUUv%cS-b+
zQU?>2%D|I^LUoE*N+M|6%Z5?-iSq~-j`5C#b-{%F_A*_)rp$1rD%3$muQH}W+rw#W
zC=j0>@$)%-nQ8e|t&+`k(+8C2AcRXt28H)JLfg{O*1F>!Z+WCxC<QzZbMPD<C1m<{
zkiKn%kt@MZT9y>vz<h^C>T_w@ER4QW>4p3jBLbcIevK(;WU*?Zgd)1*S8ruXnOoPn
zFN0M6&iuH3!nk`Re=7@2U*u6(AY5y*<GM$wlRl2EgHZP@?_LZZV4xyOp|R(-SFM??
zWF;s=sWsBp0J%E5){@I^Fbsomd;w9sU4e0WNtjK5qvFE_QViBgI>l@=K4m=YH{vDW
z4&$v9?l8y{DCtmF=-IynL20C|?h+x5J5@*qZgKn~x1KegvHkEPv5U)b2}>7_oYf-+
zgy2@ZSy%Co)I*j?;hO_K813z6e4Yi-aNsb>zc9*sEtb~}3-JP?vtn?`wt?WQshL1C
u*x-gN@ACh-L^4SI|C@NTJ%1IowROJOf5!L2oxeoD=T|!?+p^PsN&f-c(n?bR

literal 0
HcmV?d00001


From 8bfb3e89fbd8505041a1cd5f0a40117c5a1860e4 Mon Sep 17 00:00:00 2001
From: Sofia Guerra <sofia.guerra@jam3.com>
Date: Tue, 16 Aug 2022 09:51:06 -0300
Subject: [PATCH 2/5] Updating Date

---
 ...ng-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md} | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 rename _posts/{2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md => 2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md} (100%)

diff --git a/_posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
similarity index 100%
rename from _posts/2022-8-4-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
rename to _posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md

From e9244afc061f7ff56f4996870b5ab2a513f03d0a Mon Sep 17 00:00:00 2001
From: Sofia Guerra <sofia.guerra@jam3.com>
Date: Tue, 16 Aug 2022 13:26:03 -0300
Subject: [PATCH 3/5] Updating Superscript

---
 ...rch-on-intel-xeon-scalable-processors-with-bfloat16.md | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
index 4d991e8e2430..01bb5084f700 100644
--- a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
+++ b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
@@ -1,6 +1,6 @@
 ---
 layout: blog_detail
-title: "Empowering PyTorch on Intel® Xeon® Scalable processors with Bfloat16"
+title: "Empowering PyTorch on Intel<sup>®</sup> Xeon<sup>®</sup> Scalable processors with Bfloat16"
 author: Mingfei Ma (Intel), Vitaly Fedyunin (Meta), Wei Wei (Meta)
 featured-img: '\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png'
 ---
@@ -9,7 +9,7 @@ featured-img: '\assets\images\empowering-pytorch-on-intel-xeon-scalable-processo
 
 Recent years, the growing complexity of AI models have been posing requirements on hardware for more and more compute capability. Reduced precision numeric format has been proposed to address this problem. Bfloat16 is a custom 16-bit floating point format for AI which consists of one sign bit, eight exponent bits, and seven mantissa bits. With the same dynamic range as float32, bfloat16 doesn’t require a special handling such as loss scaling. Therefore, bfloat16 is a drop-in replacement for float32 when running deep neural networks for both inference and training.
 
-The 3rd Gen Intel® Xeon® Scalable processor (codenamed Cooper Lake), is the first general purpose x86 CPU with native bfloat16 support. Three new bfloat16 instructions were introduced in Intel® Advanced Vector Extensions-512 (Intel® AVX-512): VCVTNE2PS2BF16, VCVTNEPS2BF16, and VDPBF16PS. The first two instructions perform conversion from float32 to bfloat16, and the last one performs a dot product of bfloat16 pairs. Bfloat16 theoretical compute throughput is doubled over float32 on Cooper Lake. On the next generation of Intel® Xeon® Scalable Processors, bfloat16 compute throughput will be further enhanced through Advanced Matrix Extensions (Intel® AMX) instruction set extension.
+The 3rd Gen Intel<sup>®</sup> Xeon<sup>®</sup> Scalable processor (codenamed Cooper Lake), is the first general purpose x86 CPU with native bfloat16 support. Three new bfloat16 instructions were introduced in Intel<sup>®</sup> Advanced Vector Extensions-512 (Intel<sup>®</sup> AVX-512): VCVTNE2PS2BF16, VCVTNEPS2BF16, and VDPBF16PS. The first two instructions perform conversion from float32 to bfloat16, and the last one performs a dot product of bfloat16 pairs. Bfloat16 theoretical compute throughput is doubled over float32 on Cooper Lake. On the next generation of Intel<sup>®</sup> Xeon<sup>®</sup> Scalable Processors, bfloat16 compute throughput will be further enhanced through Advanced Matrix Extensions (Intel<sup>®</sup> AMX) instruction set extension.
 
 Intel and Meta previously collaborated to enable bfloat16 on PyTorch, and the related work was published in an earlier [blog](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659) during launch of Cooper Lake. In that blog, we introduced the hardware advancement for native bfloat16 support and showcased a performance boost of 1.4x to 1.6x of bfloat16 over float32 from DLRM, ResNet-50 and ResNext-101-32x4d.
 
@@ -63,7 +63,7 @@ We benchmarked inference performance of TorchVision models on Intel® Xeon® Pla
 
 ## Conclusion & Future Work
 
-In this blog, we introduced recent software optimizations on bfloat16 introduced in PyTorch 1.12. Results on the 3rd Gen Intel® Xeon® Scalable processor show that bfloat16 has 1.4x to 2.2x performance gain over float32 on the TorchVision models. Further improvement is expected on the next generation of Intel® Xeon® Scalable Processors with AMX instruction support. Though the performance number for this blog is collected with TorchVision models, the benefit is broad across all topologies. And we will continue to extend the bfloat16 optimization effort to a broader scope in the future!
+In this blog, we introduced recent software optimizations on bfloat16 introduced in PyTorch 1.12. Results on the 3rd Gen Intel<sup>®</sup> Xeon<sup>®</sup> Scalable processor show that bfloat16 has 1.4x to 2.2x performance gain over float32 on the TorchVision models. Further improvement is expected on the next generation of Intel<sup>®</sup> Xeon<sup>®</sup> Scalable Processors with AMX instruction support. Though the performance number for this blog is collected with TorchVision models, the benefit is broad across all topologies. And we will continue to extend the bfloat16 optimization effort to a broader scope in the future!
 
 ## Acknowledgement
 
@@ -73,4 +73,4 @@ The results presented in this blog is a joint effort of Meta and Intel PyTorch t
 
 - [The bfloat16 numerical format](https://cloud.google.com/tpu/docs/bfloat16?hl=en)
 - [https://pytorch.org/docs/master/amp.html#torch.autocast](https://pytorch.org/docs/master/amp.html#torch.autocast)
-- [Intel and Facebook Accelerate PyTorch Performance with 3rd Gen Intel® Xeon® Processors and Intel® Deep Learning Boost’s new BFloat16 capability](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659)
\ No newline at end of file
+- [Intel and Facebook Accelerate PyTorch Performance with 3rd Gen Intel® Xeon® Processors and Intel<sup>®</sup> Deep Learning Boost’s new BFloat16 capability](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659)
\ No newline at end of file

From f8d26486e80b304955bee912036e18266d3a8a8b Mon Sep 17 00:00:00 2001
From: Sofia Guerra <sofia.guerra@jam3.com>
Date: Tue, 16 Aug 2022 13:43:28 -0300
Subject: [PATCH 4/5] Updating superscript

---
 ...pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
index 01bb5084f700..117f586a7d68 100644
--- a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
+++ b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
@@ -1,6 +1,6 @@
 ---
 layout: blog_detail
-title: "Empowering PyTorch on Intel<sup>®</sup> Xeon<sup>®</sup> Scalable processors with Bfloat16"
+title: "Empowering PyTorch on Intel® Xeon® Scalable processors with Bfloat16"
 author: Mingfei Ma (Intel), Vitaly Fedyunin (Meta), Wei Wei (Meta)
 featured-img: '\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png'
 ---
@@ -73,4 +73,4 @@ The results presented in this blog is a joint effort of Meta and Intel PyTorch t
 
 - [The bfloat16 numerical format](https://cloud.google.com/tpu/docs/bfloat16?hl=en)
 - [https://pytorch.org/docs/master/amp.html#torch.autocast](https://pytorch.org/docs/master/amp.html#torch.autocast)
-- [Intel and Facebook Accelerate PyTorch Performance with 3rd Gen Intel® Xeon® Processors and Intel<sup>®</sup> Deep Learning Boost’s new BFloat16 capability](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659)
\ No newline at end of file
+- [Intel and Facebook Accelerate PyTorch Performance with 3rd Gen Intel® Xeon® Processors and Intel® Deep Learning Boost’s new BFloat16 capability](https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Intel-and-Facebook-Accelerate-PyTorch-Performance-with-3rd-Gen/post/1335659)
\ No newline at end of file

From 5518c929fee3b6069aff946546baa5ca6b7ff009 Mon Sep 17 00:00:00 2001
From: Sofia Guerra <sofia.guerra@jam3.com>
Date: Thu, 18 Aug 2022 11:22:15 -0300
Subject: [PATCH 5/5] Fixing featured image

---
 ...pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
index 117f586a7d68..f074757c24c2 100644
--- a/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
+++ b/_posts/2022-8-16-empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.md
@@ -2,7 +2,7 @@
 layout: blog_detail
 title: "Empowering PyTorch on Intel® Xeon® Scalable processors with Bfloat16"
 author: Mingfei Ma (Intel), Vitaly Fedyunin (Meta), Wei Wei (Meta)
-featured-img: '\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png'
+featured-img: '/assets/images/empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png'
 ---
 
 ## Overview
@@ -52,7 +52,7 @@ Generally, the explicit conversion approach and AMP approach have similar perfor
 We benchmarked inference performance of TorchVision models on Intel® Xeon® Platinum 8380H CPU @ 2.90GHz (codenamed Cooper Lake), single instance per socket (batch size = 2 x number of physical cores). Results show that bfloat16 has 1.4x to 2.2x performance gain over float32.
 
 <p align="center">
-  <img src="\assets\images\empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png" width="100%">
+  <img src="/assets/images/empowering-pytorch-on-intel-xeon-scalable-processors-with-bfloat16.png" width="100%">
 </p>
 
 ## The performance boost of bfloat16 over float32 primarily comes from 3 aspects: