Source code for PseudoNetCDF.camxfiles.uamiv.Read

from __future__ import print_function
__all__ = ['uamiv']
__doc__ = """
.. _Read
:mod:`Read` -- uamiv Read interface
============================================

.. module:: Read
   :platform: Unix, Windows
   :synopsis: Provides :ref:`PseudoNetCDF` random access read for CAMx
              uamiv files.  See PseudoNetCDF.sci_var.PseudoNetCDFFile
              for interface details
.. moduleauthor:: Barron Henderson <barronh@unc.edu>
"""

# Distribution packages
import unittest
import struct

# Site-Packages
from numpy import zeros, array, newaxis

# This Package modules
from PseudoNetCDF.camxfiles.timetuple import timediff, timerange
from PseudoNetCDF.camxfiles.util import sliceit
from PseudoNetCDF.camxfiles.units import get_uamiv_units, get_chemparam_names
from PseudoNetCDF.camxfiles.FortranFileUtil import OpenRecordFile, read_into
from PseudoNetCDF.camxfiles.FortranFileUtil import Int2Asc
from PseudoNetCDF.sci_var import PseudoNetCDFFile, PseudoNetCDFVariables


# for use in identifying uncaught nan
listnan = struct.unpack('>f', b'\xff\xc0\x00\x00')[0]
checkarray = zeros((1,), 'f')
checkarray[0] = listnan
array_nan = checkarray[0]



[docs]
class uamiv(PseudoNetCDFFile):
    """
    uamiv provides a PseudoNetCDF interface for CAMx
    uamiv files.  Where possible, the inteface follows
    IOAPI conventions (see www.baronams.com).

    ex:
        >>> uamiv_path = 'camx_uamiv.bin'
        >>> rows,cols = 65,83
        >>> uamivfile = uamiv(uamiv_path,rows,cols)
        >>> uamivfile.variables.keys()
        ['TFLAG', 'O3', 'NO', 'NO2', ...]
        >>> tflag = uamivfile.variables['TFLAG']
        >>> tflag.dimensions
        ('TSTEP', 'VAR', 'DATE-TIME')
        >>> tflag[0,0,:]
        array([2005185,       0])
        >>> tflag[-1,0,:]
        array([2005185,  240000])
        >>> v = uamivfile.variables['O3']
        >>> v.dimensions
        ('TSTEP', 'LAY', 'ROW', 'COL')
        >>> v.shape
        (25, 28, 65, 83)
        >>> uamivfile.dimensions
        {'TSTEP': 25, 'LAY': 28, 'ROW': 65, 'COL': 83}
    """

    emiss_hdr_fmt = "10i60i3ifif"
    grid_hdr_fmt = "ffiffffiiiiifff"
    cell_hdr_fmt = "iiii"
    time_hdr_fmt = "ifif"
    spc_fmt = "10i"
    id_fmt = "i" + spc_fmt
    id_size = struct.calcsize(id_fmt)
    data_fmt = "f"
    ione = 1
    idum = 0
    rdum = 0.

    def __init__(self, rf, chemparam=None):
        """
        Initialization included reading the header and learning
        about the format.

        see __readheader and __gettimestep() for more info
        """

        self.rffile = OpenRecordFile(rf)
        if chemparam is None:
            self._aerosol_names = None
        else:
            self._aerosol_names = get_chemparam_names(chemparam)

        self.padded_time_hdr_size = struct.calcsize(self.time_hdr_fmt + "ii")
        self.__readheader()
        self.__gettimestep()
        self.dimensions = {}
        self.createDimension('LAY', self.nlayers)
        self.createDimension('COL', self.nx)
        self.createDimension('ROW', self.ny)
        self.createDimension('TSTEP', self.time_step_count)
        self.createDimension('DATE-TIME', 2)

        self.variables = PseudoNetCDFVariables(
            self.__var_get, [sn.strip() for sn in self.spcnames])

    def __var_get(self, key):
        units = get_uamiv_units(self.name, key, self._aerosol_names)
        spcnames = [sn.strip() for sn in self.spcnames]
        if self.name == 'EMISSIONS ':
            def constr(spc):
                return self.getArray(
                    nspec=spcnames.index(spc)).squeeze()[:, newaxis, :, :]

            def decor(spc):
                return dict(units=units, var_desc=spc,
                            long_name=spc.ljust(16))
        else:
            ntimes = len(self.dimensions['TSTEP'])
            nlays = len(self.dimensions['LAY'])
            nrows = len(self.dimensions['ROW'])
            ncols = len(self.dimensions['COL'])

            def constr(spc):
                return self.getArray(nspec=spcnames.index(
                    spc)).squeeze().reshape(ntimes, nlays, nrows, ncols)

            def decor(spc):
                return dict(units=units, var_desc=spc.ljust(16),
                            long_name=spc.ljust(16))

        values = constr(key)
        var = self.createVariable(key, 'f', ('TSTEP', 'LAY', 'ROW', 'COL'))
        var[:] = values
        for k, v in decor(key).items():
            setattr(var, k, v)
        return var


[docs]
    def header(self):
        rdum = self.rdum
        idum = self.idum
        ione = self.ione
        return [
            [self.name, self.note, ione, self.nspec, self.start_date,
                self.start_time, self.end_date, self.end_time],
            [rdum, rdum, self.iutm, self.xorg, self.yorg, self.delx, self.dely,
                self.nx, self.ny, self.nz, idum, idum, rdum, rdum, rdum],
            [ione, ione, self.nx, self.ny],
            self.spcnames
        ]


    def __readheader(self):
        """
        __readheader reads the header section of the ipr file
        it initializes each header field (see CAMx Users Manual for a list)
        as properties of the ipr class
        """
        vals = self.rffile.read(self.emiss_hdr_fmt)
        self.name = vals[0:10]
        self.note = vals[10:70]
        ione = vals[70]
        self.nspec = vals[71]
        self.start_date, self.start_time = vals[72], vals[73]
        self.end_date, self.end_time = vals[74], vals[75]

        self.name = Int2Asc(self.name)
        self.note = Int2Asc(self.note)

        vals = self.rffile.read(self.grid_hdr_fmt)
        self.rdum, rdum, self.iutm = vals[0:3]
        self.xorg, self.yorg, self.delx, self.dely = vals[3:7]
        self.nx, self.ny, self.nz = vals[7:10]
        idum, self.idum, rdum, rdum, rdum = vals[10:]

        if self.name == 'EMISSIONS ':
            # Special case of gridded emissions
            # Seems to be same as avrg
            self.nlayers = 1
        else:
            self.nlayers = self.nz
        self.ione, ione, nx, ny = self.rffile.read(self.cell_hdr_fmt)
        if not (self.nx, self.ny) == (nx, ny):
            raise ValueError(("nx, ny defined first as %i, %i and then " +
                              "as %i, %i") % (self.nx, self.ny, nx, ny))
        species_temp = self.rffile.read(self.nspec * self.spc_fmt)
        self.spcnames = []
        for i in range(0, self.nspec * 10, 10):
            self.spcnames.append(Int2Asc(species_temp[i:i + 10]))

        self.data_start_byte = self.rffile.record_start
        start_date, start_time, end_date, end_time = self.rffile.read(
            self.time_hdr_fmt)

        self.time_step = timediff(
            (start_date, start_time), (end_date, end_time))
        mystep = (2400, 24)[int(self.time_step % 2)]
        self.time_step_count = int(timediff((self.start_date, self.start_time),
                                            (self.end_date, self.end_time),
                                            mystep) // self.time_step)
        if self.name == 'AIRQUALITY':
            self.time_step_count = 1
            self.start_date = self.end_date
        self.record_size = self.rffile.record_size
        self.padded_size = self.record_size + 8
        self.cell_count = (self.record_size - struct.calcsize("i10i")
                           ) // struct.calcsize(self.data_fmt)
        self.record_fmt = ("i10i") + self.data_fmt * (self.cell_count)

    def __gettimestep(self):
        """
        this is taken care of in the readheader routine
        record format provides start and end for each hour,
        which translates to t1 and t2
        """
        pass

    def __timerecords(self, dt):
        """
        Calculate the number of records to increment to reach time (d,t)
        """
        d, t = dt
        nsteps = int(
            timediff((self.start_date, self.start_time), (d, t)) /
            self.time_step)
        nspec = self.__spcrecords(self.nspec + 1)
        return nsteps * nspec

    def __layerrecords(self, k):
        """Calculate the number of records to increment to reach layer k
        """
        return k - 1

    def __spcrecords(self, spc):
        """
        Calculated number of records before spc
        """
        return (spc - 1) * self.__layerrecords(self.nlayers + 1)

    def __recordposition(self, date, time, spc, k):
        """
        Use time (d,t), spc, and k to calculate number of records before
        desired record

        date - integer julian
        time - float
        spc - integer
        k - integer
        """
        ntime = self.__timerecords((date, time))
        nk = self.__layerrecords(k)
        nid = ntime // self.nspec // self.nlayers
        nspec = 0
        if spc != 0:
            nid += 1
            nspec = self.__spcrecords(spc)

        out = (self.data_start_byte + (nspec + nk + ntime) *
               self.padded_size + nid * self.padded_time_hdr_size)
        return out


[docs]
    def seek(self, date=None, time=None, spc=-1, k=0, chkvar=True):
        """
        Move file cursor to the beginning of the specified record
        see __recordposition for parameter definitions
        """
        spc += 1
        if date is None:
            date = self.start_date
        if time is None:
            time = self.start_time

        if (
            chkvar and
            timediff((self.end_date, self.end_time), (date, time), 24) > 0 or
            timediff((self.start_date, self.start_time), (date, time), 24) < 0
        ):
            raise KeyError(("Gridded emission file includes (%i,%6.1f) " +
                            "thru (%i,%6.1f); you requested (%i,%6.1f)") %
                           (self.start_date, self.start_time,
                            self.end_date, self.end_time, date, time))
        if chkvar and spc < 1 or spc > self.nspec:
            raise KeyError(("Gridded emission file include species 1 thru " +
                            "%i; you requested %i") % (self.nspec, spc))

        # self.rffile._newrecord(self.__recordposition(date,time,1,0))
        # start_date,start_time,end_date,end_time=self.rffile.read("ifif")
        self.rffile._newrecord(self.__recordposition(date, time, spc, k))



[docs]
    def read(self):
        """
        Provide direct access to record file read
        """
        return self.rffile.read(self.record_fmt)



[docs]
    def read_into(self, dest):
        """
        Transfer values from current record to dest
        dest - numeric or numpy array
        """
        return read_into(self.rffile, dest, self.id_fmt, self.data_fmt)



[docs]
    def seekandreadinto(self, dest, date=None, time=None, spc=1, k=1):
        """
        see seek and read_into
        """
        self.seek(date, time, spc, k)
        self.read_into(dest)



[docs]
    def seekandread(self, date=None, time=None, spc=1, k=1):
        """
        see seek and read
        """
        self.seek(date, time, spc, k)
        return self.read()



[docs]
    def values(self):
        for d, t, spc, k in self.__iter__():
            yield self.seekandread(d, t, spc, k)



[docs]
    def items(self):
        for d, t, spc, k in self.__iter__():
            yield d, t, spc, k, self.seekandread(d, t, spc, k)



[docs]
    def keys(self):
        for d, t in self.timerange():
            for spc in range(len(self.spcnames)):
                for k in range(1, self.nlayers + 1):
                    yield d, t, spc, k

    __iter__ = keys


[docs]
    def close(self):
        self.rffile.infile.close()



[docs]
    def getArray(self, krange=slice(1, None), nspec=slice(None),
                 nx=slice(None), ny=slice(None)):
        """Method takes slice arguments. Alternatively, takes a hashable object
        with 2 values (e.g., the list: [0,3]).
        Arguments:
        krange    vertical slice (1 indexed)
        nspec     species  slice (0 indexed)
        nx        column   slice (0 indexed)
        ny        row      slice (0 indexed)
        """
        krange = sliceit(krange)
        nspec = sliceit(nspec)
        nx = sliceit(nx)
        ny = sliceit(ny)

        a = zeros(
            (
                self.time_step_count,
                len(range(*nspec.indices(self.nspec))),
                len(range(*krange.indices(self.nlayers + 1))),
                self.ny,
                self.nx), 'f')
        nlay = self.nlayers
        for ti, (d, t) in enumerate(self.timerange()):
            for sidx, spc in enumerate(range(*nspec.indices(self.nspec))):
                for kidx, k in enumerate(range(*krange.indices(nlay + 1))):
                    self.seekandreadinto(a[ti, sidx, kidx, ...], d, t, spc, k)

        return a[..., ny, nx]



[docs]
    def timerange(self):
        return timerange((self.start_date, self.start_time),
                         (self.end_date, self.end_time), self.time_step, 24)




class TestuamivRead(unittest.TestCase):
    def runTest(self):
        pass

    def setUp(self):
        pass

    def testGE(self):
        import PseudoNetCDF.testcase
        emissfile = uamiv(PseudoNetCDF.testcase.camxfiles_paths['uamiv'])
        v = emissfile.variables['NO2']
        self.assertTrue((v == array(
            [0.00000000e+00, 0.00000000e+00, 0.00000000e+00, 0.00000000e+00,
             0.00000000e+00, 0.00000000e+00, 1.24175494e-04, 2.79196858e-04,
             1.01672206e-03, 4.36782313e-04, 0.00000000e+00, 1.54810550e-04,
             3.90250643e-04, 6.18023798e-04, 3.36963218e-04, 0.00000000e+00,
             1.85579920e-04, 1.96825975e-04, 2.16468165e-04, 2.19882189e-04],
            dtype='f').reshape(1, 1, 4, 5)).all())


if __name__ == '__main__':
    unittest.main()